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La revisión de este libro de texto ha sido un desafío especial por una razón bastante agra- 
dable. Mucha gente ha leído este libro, enseñado a partir de él e inclusive lo ha querido. 
Quizá el espíritu del libro no cambie jamás. Este texto fue escrito como ayuda para que 
nuestra enseñanza del álgebra lineal mantenga la importancia crucial de este tema, que si- 
gue creciendo. 

Ciertamente, un paso era posible y aconsejable: añadir nuevos problemas. Tantos años 
de enseñanza requirieron cientos de reactivos de examen nuevos (especialmente con inte- 
rrogantes que impliquen el uso de la red). Considero que el lector aprobará la amplia gama 
de problemas. Los reactivos siguen siendo una mezcla de explicación y cálculo: los dos 
métodos complementarios para aprender este hermoso tema. | 

Personalmente considero que mucha más gente necesita álgebra lineal que cálculo. 
¡Isaac Newton podría no estar de acuerdo! Sin embargo, él no está enseñando matemáticas 
en el siglo XX1 (y quizá no fue un gran profesor, aunque le otorgaremos el beneficio de la 
duda). Ciertamente, las leyes de la Física se expresan bien mediante ecuaciones diferencia- 
les. Newton requirió del cálculo, lo cual está bien. Pero el alcance de la ciencia, la ingenie- 
ría y la administración (así como de la vida) actualmente es mucho más grande, y el álgebra 
lineal se ha desplazado a un sitio nodal. 

Podría decir algo más, ya que muchas universidades aún no ajustan el equilibrio hacia 
el álgebra lineal. Al trabajar con líneas curvas y superficies curvas, el primer paso siempre 
es linealizar. Sustituir la curva por su recta tangente, ajustar la superficie por un plano y 
entonces el problema se vuelve lineal. El poder de este tema se hace evidente cuando se 
tienen 10 variables, o 1000, en vez de dos. 

Quizá el lector piense que estoy exagerando cuando uso la palabra “hermoso” para un 
curso básico de matemáticas. En absoluto. Este curso empieza con dos vectores Y y w que 
apuntan en direcciones distintas. El paso clave es tomar sus combinaciones lineales, Se mul- 
tiplica para Obtener 3v y 4w, y se suma para obtener una combinación particular 3v + 4w. 
Este nuevo vector está en el mismo plano que v y w. Cuando se toman todas las combina- 
ciones, se está llenando todo el plano. Si y y w se dibujan en esta página, sus combinacio- 
nes cu + du llenan la página (y más allá), pero no salen de la página. 

En el lenguaje de las ecuaciones lineales, cv + dw = b puede resolverse exactamen- 
te cuando el vector b está en el mismo plano que v y w. 


Matrices 


Se avanzará un poco más para convertir combinaciones de vectores tridimensionales al 
álgebra lineal. Si los vectores son v = (1, 2, 3) y w = (1, 3, 4), se escriben en una matriz 
columna: 
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Para encontrar combinaciones de estas columnas, la matriz se “multiplica” por un vector 


(c, d): 


1 1 1 1 
Combinaciones lineales cv + dw LS 5 =c12l|+413 
NS bs 3 4 


Estas combinaciones llenan un espacio vectorial, denominado espacio columna de la ma- 
triz. (Para estas dos columnas, dicho espacio es un plano.) Para decidir si b = (2, 5, 7) es- 
tá en ese plano, se cuenta con tres componentes para lograrlo. Así, hay que resolver tres 
ecuaciones: 


AL le 2 c+ d=2 
Do A = |5| significa 2c+3d =5 
3 4 ye 3c+4d =7, 


Se deja que el lector las resuelva. El vector b = (2, 5, 7) no está en el plano de y y w. Si 
el 7 se cambia por cualquier otro número, entonces b no está en el plano; de hecho, no es 
ninguna combinación de v y Ww, por lo que las tres ecuaciones no tienen solución. 

Ahora es posible describir la primera parte del libro, sobre ecuaciones lineales Ax = 
b. La matriz A tiene n columnas y m renglones. El álgebra lineal se desplaza de manera 
continua hacia n vectores en el espacio m-dimensional. Siguen buscándose combinaciones 
de las columnas (en el espacio columna). Siguen obteniéndose m ecuaciones para producir 
b (una por cada renglón). Estas ecuaciones pueden o no tener una solución. Siempre tienen 
una solución por mínimos cuadrados. 

La interacción de las columnas y los renglones constituye el núcleo del álgebra lineal. 
No es totalmente fácil comprenderlo, aunque tampoco es tan difícil. A continuación se enu- 
meran cuatro de los conceptos más importantes: 


1. El espacio columna (todas las combinaciones de las columnas). 

2. El espacio renglón (todas las combinaciones de los renglones). 

3. El rango (el número de columnas independientes) (o renglones). 

4. Eliminación (la forma idónea para encontrar el rango de una matriz). 


Y aquí me detengo para permitirle iniciar el curso. 


Páginas web 


Quizá sea útil mencionar las páginas de la red conectadas con este libro. Recibimos 
muchos mensajes con sugerencias y palabras de aliento, por lo que espero que el lector 
utilice todo con libertad. Puede acceder directamente a http://web.mit.edu/ 18.06, que se ac- 
tualiza constantemente para el curso que se imparte cada semestre. Álgebra lineal también 
está en el sitio del MIT OpenCourseWare h:tp://ocw.mit.edu, donde 18.06 se volvió excep- 
cional al incluir videos de las conferencias (que, por supuesto, usted no tiene que ver...). 
A continuación se menciona una parte del material disponible en la red: 


1. Programa de conferencias y tareas y exámenes actuales con soluciones. 

2. Los objetivos del curso, así como preguntas conceptuales. 

3. Demos interactivos Java (ahora ya se cuenta con audio para los valores característi- 
cos). 

4. Códigos de enseñanza del álgebra lineal y problemas MATLAB. 

5. Videos de todo el curso (tal y como se enseña en un aula real). 


La página del curso se ha convertido en un vínculo valioso para la clase y un recurso para 
los estudiantes. Estoy bastante optimista sobre el potencial de las gráficas sonoras. El an- 
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cho de banda para la voz en off es bajo, y FlashPlayer está disponible de manera gratuita. 
Esto ofrece un repaso rápido (con experimentos activos), y es posible bajar todas las con- 
ferencias. Espero que los profesores y estudiantes de todo el mundo encuentren útiles es- 
tas páginas web. Mi objetivo es hacer este libro lo más útil posible con todo el material del 
curso que puedo proporcionar. 


Nota importante: La administración de estas páginas Web y de otras mencionadas dentro 
del libro no está a cargo de Thomson Learning Iberoamérica, por lo que la editorial no es 
responsable de las modificaciones en el contenido y los cambios en las políticas y formas 
de acceso que pudieran ocurrir. Le recomendamos visitar frecuentemente estos sitios a fin de 
estar al tanto de cualquier actualización. 


Complementos 


Este libro cuenta con complementos para el profesor, los cuales están en inglés y sólo se 
proporcionan a los docentes que adopten la presente obra como texto para sus cursos. Pa- 
ra mayor información, favor de comunicarse con las oficinas de nuestros representantes o 
a los siguientes correos electrónicos: 


Thomson México y Centroamérica clientes Othomsonlearning.com.mx. 
Thomson América del Sur cliente Othomsonlearmning.com 
Thomson Caribe amy.reyes O thomsonleaming.com 


Estructura del curso 


Los dos problemas fundamentales son Ax = b y Ax = Ax para matrices cuadradas A. El 
primer problema Ax = 5 tiene una solución cuando las columnas de A son independientes. 
El segundo problema Ax = Ax es para vectores característicos independientes. Una parte 
crucial de este curso es aprender el significado de “independencia”. 

Considero que la mayoría de nosotros aprendemos primero a partir de ejemplos. Pue- 
de ver que 


¡0% 
AS no tiene columnas independientes. 
1.3 4 


La columna 1 más la columna 2 es igual a la columna 3. Un teorema maravilloso del álge- 
bra establece que los tres renglones tampoco son independientes. El tercer renglón debe 
estar en el mismo plano que los dos primeros renglones. Con alguna combinación de los 
renglones 1 y 2 se obtiene el renglón 3. Quizá el lector pueda encontrar rápidamente esta 
combinación (yo no pude). Al final tuve que usar eliminación para descubrir que la com- 
binación correcta utiliza 2 veces el renglón 2, menos el renglón 1. 

La eliminación es la forma simple y natural para entender una matriz al producir bastan- 
tes elementos iguales a cero. Por tanto, el curso empieza aquí. ¡Pero no se quede demasiado 
aquí! El lector debe proceder de combinaciones de los renglones a independencia de los 
renglones a la “dimensión del espacio renglón”. Este es el objetivo clave, abordar todos 
los espacios de los vectores: el espacio renglón, el espacio columna y el espacio nulo. 

Otro objetivo es comprender la manera en que actúa la matriz. Cuando A se multipl- 
ca por x se obtiene el nuevo vector Ax. Todo el espacio de vectores se mueve; es “transfor- 
mado” por A. Transformaciones especiales se obtienen de matrices particulares, y aquéllas 
son las primeras piedras del álgebra lineal: matrices diagonales, matrices ortogonales, ma- 
trices triangulares, matrices simétricas. 
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Matrices, y eliminación gaussiana 


Los valores característicos de estas matrices también son importantes. Considero que 
las matrices de 2 por 2 constituyen ejemplos contundentes de la información que pueden 
proporcionar los valores característicos A. Las secciones 5.1 y 5.2 ameritan una lectura cui- 
dadosa para ver la manera en que Ax = Ax es de utilidad. Ahí se presenta un caso en que 
matrices pequeñas permiten la obtención de muchísimo conocimiento. 

En forma global, la belleza del álgebra lineal puede apreciarse de varias maneras: 


1. Visualización. Combinación de vectores. Espacios de vectores. Rotación, reflexión 
y proyección de vectores. Vectores perpendiculares. Cuatro subespacios fundamentales. 


2. Abstracción. Independencia de vectores. Base y dimensión de un espacio vectorial. 
Transformaciones lineales. Descomposición del valor singular y la mejor base. 


3. Cálculo. Eliminación para producir elementos cero. Gram-Schmidt para producir 
vectores ortogonales. Valores característicos para resolver ecuaciones diferenciales y en di- 


ferencias. 


4. Aplicaciones. Solución por mínimos cuadrados cuando Ax = b tiene demasiadas 
ecuaciones. Ecuaciones en diferencias que aproximan ecuaciones diferenciales. Matrices 
de probabilidad de Markov (¡la base para Google!). Vectores característicos ortogonales 
como ejes principales (y más .. .). 


Para continuar con estas aplicaciones, se mencionan los libros publicados por Welles- 
ley-Cambridge Press. Todos aparentan ser de álgebra, aplicados al procesamiento de seña- 
les, a ecuaciones diferenciales parciales y a cálculos científicos (e inclusive GPS: Sistema 
de Posicionamiento Global). Si el lector consulta la página http.//www.wellesleycambride. 
com, verá parte de la razón por la que el álgebra lineal es tan utilizada. 

Después de este prefacio, el libro hablará por sí mismo. De inmediato observará el es- 
píritu. El énfasis se pone en la comprensión: intento explicar, más que deducir. Este es un 
libro sobre matemáticas verdaderas, no un ejercicio interminable. En clase, constantemen- 
te trabajo con ejemplos para enseñar lo que necesitan los estudiantes. 


Agradecimientos 


Disfruté la redacción de este libro, y ciertamente espero que el lector disfrute leyéndolo. 
Mucho de este placer proviene por haber trabajado con amigos. Recibí una ayuda mara- 
villosa de Brett Coonley, Cordula Robinson y Erin Maneri, quienes crearon los archivos 
PT X y trazaron todas las figuras. Sin el apoyo constante de Brett nunca hubiera podido 
terminar esta nueva edición. 

Steven Lee y Cleve Moler me proporcionaron ayuda previa con los códigos de ense- 
ñanza. Ellos siguieron los pasos descritos en el libro: MATLAB, Maple y Mathematica son 
más rápidos para matrices grandes. Todos pueden utilizarse (de manera opcional) en este 
curso. Hubiera podido añadir “Factorización” a la lista anterior, como una quinta avenida 
para la comprensión de las matrices: 
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1.1 INTRODUCCIÓN 


Este libro empieza con el problema central del álgebra lineal: la solución de ecuaciones li- 
neales. El caso más importante, y el más sencillo, es cuando el número de incógnitas es igual 
al número de ecuaciones. Se tienen n ecuaciones en n incógnitas, empezando con n = 2: 


Dos ecuaciones IX A y AA 
LS (1) 
Dos incógnitas 4 + 5y = 6 


Las incógnitas son x y y. Para resolver estas ecuaciones requiero, describir dos métodos el 
de eliminación y el de determinantes. Ciertamente, x y y están determinadas por los núme- 
ros 1,2, 3, 4, 5, 6. La cuestión es cómo utilizar estos seis números para resolver el sistema. 


1. Eliminación Dela segunda ecuación, réstese 4 veces la primera ecuación. Así se eli- 
mina x de la segunda ecuación, y queda una ecuación para y: 


(2) 


(ecuación 2) — 4A(ecuación 1) 





De inmediato se sabe que y = 2. Luego, x se conoce a partir de la primera ecuación, 
lx + 2y =3: 





Con sustitución hacia atrás —1x+2(2)=3 se obtiene (3) 
Procediendo cuidadosamente, se comprueba que x y y también resuelven la segunda 
ecuación. Esto debe funcionar, como es el caso: 4 veces (x = — 1) más 5 veces (y = 2) 
es igual a 6. 


2. Determinantes La solución y = 2 depende completamente de los seis números en 


las ecuaciones. Debe haber una fórmula para y (y también para x). Se trata de una “razón 
de determinantes”, que espero, el lector me permita escribir directamente: 


g An o. 
A k 
Es 
a E E5 e 
a - 9 
S MM 
"e 
- A e 
de . 
$ 
¿EN 
4 cad 
e B 
E . 
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4x +5y=6 


Matrices y eliminación gaussiana 


Lo anterior puede parecer algo misterioso, a menos que el lector ya conozca algo sobre de- 
terminantes de 2 por 2. Estos determinantes proporcionan la misma respuesta y = 2, pro- 
veniente de la misma razón de -6 a 3. Si nos quedamos con los determinantes (lo cual no 
pensamos hacer), hay una fórmula semejante para calcular la otra incógnita, x: 






HE ; 

6 5 Y 3 

= -—— =: A 5 

O e dd 
4 5 


A continuación se compararán ambos métodos, pensando en futuros problemas reales 
en los que n es mucho más grande (n = 1000 es un tamaño bastante moderado en cálculos 
científicos). Lo cierto es que el uso directo de la fórmula de los determinantes para 1000 
ecuaciones puede ser un desastre total, ya que el millón de números a la izquierda se utiliza- 
ría correcta pero ineficazmente. Esta fórmula se encontrará en el capítulo 4 (regla de Cramen), 
aunque en el capítulo 1 se presenta un método aceptable para resolver 1000 ecuaciones. 

Este método aceptable es la eliminación gaussiana. Se trata del algoritmo que suele 
aplicarse de manera constante para resolver grandes sistemas de ecuaciones. A partir de los 
ejemplos en un libro de texto (n = 3 se aproxima al límite superior de la paciencia del au- 
tor y del lector), quizá el lector no puede apreciar mucha diferencia, En las ecuaciones (2) 
y (4) se siguieron esencialmente los mismos pasos para encontrar y = 2. Ciertamente, x se 
conoció más rápido por la sustitución hacia atrás en la ecuación (3) que la razón en (5). Pa- 
ra n más grande, no hay caso. Gana la eliminación (e incluso este método es el mejor para 
calcular determinantes). 

La idea de eliminación es engañosamente simple: el lector la dominará luego de unos 
cuantos ejemplos. Constituye la base de la mitad de este libro, simplificando una matriz de 
modo que sea posible comprenderla. Junto con la mecánica del algoritmo, en este capítulo 
es necesario explicar cuatro aspectos más profundos. Éstos son: 


1. Las ecuaciones lineales llevan a la geometría de planos. No es fácil visualizar un pla- 
no nueve-dimensional en un espacio de diez dimensiones. Es más difícil ver diez de es- 
tos planos, que se cortan en la solución de diez ecuaciones, aunque de alguna manera 
esto es casi posible. Nuestro ejemplo tiene dos rectas en la figura 1.1, que se encuen- 
tran en el punto (x, y) = (—1, 2). El álgebra lineal mueve esta imagen hacia diez di- 
mensiones, donde la intuición debe imaginar la geometría (y la obtiene correctamente). 

2. Pasamos a la notación matricial al escribir las n incógnitas como un vector x y las n 
ecuaciones como Ax = b. Multiplicamos A por “matrices de eliminación” con la fina- 
lidad de obtener una matriz triangular superior U. Con lo anterior, A se factoriza en L 
veces U, donde L es triangular inferior. 





Una solución (x, y) = (— 1, 2) Paralelas: no hay solución Recta completa de soluciones 


Figura 1.1 El ejemplo tiene una solución. Los casos singulares no tienen solución, o tie- 
nen demasiadas soluciones. 
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A continuación se escribirán A y sus factores para nuestro ejemplo, y se explicarán en 
su debido momento: 


Factorización AÁ = E | = a A E E =L veces U. (6) 
Primero es necesario presentar las matrices, los vectores y las reglas de la multiplica- 
ción. Toda matriz tiene una fraspuesta A*. Esta matriz, tiene una inversa A”?, 

3. En la mayor parte de los casos, la eliminación se realiza sin dificultades. La matriz tie- 
ne una inversa, y el sistema Ax = b tiene una solución. En casos excepcionales el mé- 
todo falla, ya sea que las ecuaciones se escribieron en orden equivocado, lo cual se 
arregla fácilmente al intercambiarlas, o las ecuaciones no tienen una solución única. 

El caso singular aparece si 8 se sustituye por 3 en nuestro ejemplo: 


Caso singular lx + 2y = 3 


7 
Dos rectas paralelas 4x + 8y = 6. E 


La eliminación resta simplemente 4 veces la primera ecuación de la segunda. Sin em- 
bargo, ¡observe el resultado! 





(ecuación 2) —- 4(ecuación 1) 


NY 


Este caso singular no tiene solución. Otros casos singulares tienen una infinidad de 
soluciones. (Cambie 6 a 12 en el ejemplo, y la eliminación producirá O = O. Así, y, 
puede asumir cualquier valor.) Cuando la eliminación falla, se quiere encontrar toda 
solución posible. 

4. Se requiere una estimación aproximada del número de pasos de eliminación necesa- 
rios para resolver un sistema de tamaño n. El costo de cómputo a menudo determina 
la precisión del modelo. Cien ecuaciones requieren alrededor de 300 000 pasos (mul- 
tiplicaciones y restas). La computadora es capaz de hacer estos pasos rápidamente, pe- 
ro no es así para el caso de varios billones de pasos. Y después de un millón de pasos, 
el error por redondeo puede ser significativo. (Algunos problemas son sensibles; otros 
no.) Sin entrar en todos los detalles, pretendemos considerar grandes sistemas que se 
presentan en la práctica, así como la manera en que se resuelven realmente. 


El resultado final de este capítulo, es un algoritmo de eliminación que es casi lo más 
eficaz posible. Se trata del algoritmo que suele usarse en una numerosa variedad de aplica- 
ciones. Y al mismo tiempo, comprenderlo en términos de matrices —la matriz de coeficien- 
tes A, las matrices E y P para la eliminación e intercambio de renglones, respectivamente, 
y los factores finales L y U-—— es un fundamento esencial de la teoría. Espero que el lector 
disfrute este libro y su curso. 


1.2 GEOMETRÍA DE LAS ECUACIONES LINEALES 


La forma de comprender este tema es mediante un ejemplo. Se empieza con dos ecuacio- 
nes extremadamente simples, reconociendo que el lector puede resolverlas sin necesidad 
de llevar un curso de álgebra lineal. No obstante, espero que le dé una oportunidad a Gauss: 
2x y=l 
y O e 
Este sistema puede abordarse por renglones o por columnas. Queremos abordarlo en am- 
bas formas. 


Capítulo 1 Matrices y eliminación gaussiana 


El primer método se centra en las ecuaciones por separado (los renglones). Es el más 
conocido, y en dos dimensiones se hace rápidamente. La ecuación 2x — y = 1 se represen- 
ta por una línea recta en el plano x-y. La recta pasa por los puntos x= 1,y=1yx=3, 
y = 0 (y también por (2, 3) y todos los puntos intermedios). La segunda ecuación, x + y S 
= $, produce una segunda recta (véase la figura 1.2a). Su pendiente es dy/dx = —1 y cor- 
ta a la primera recta en la solución. 

El punto de intersección pertenece a ambas rectas. Se trata de la única solución de las 


dos ecuaciones. El punto x = 2 y y = 3 se encontrará pronto por “eliminación”. 





2 (columna 1) 
+3 (columna 2) 
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a) Las rectas se cortan en b) Las columnas se combinan con 2 y 3 
2=2y=3 





A OS 


Figura 1.2 Representación por renglón (dos rectas) y representación por columna (se 
combinan columnas). 


NR 
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El segundo método considera las columnas del sistema lineal. Las dos ecuaciones por 
separado en realidad son una ecuación vectorial: 


Forma de columna x h + y 7 Ñ = B 


¿8 
CA q 


El problema consiste en encontrar la combinación de los vectores columna en el miembro 
izquierdo que produce el vector del miembro derecho. Los vectores (2, 1) y (— 1, 1) se re- 
presentan con las líneas gruesas en la figura 1.2b. Las incógnitas son los números x y y que 
multiplican a los vectores columna. Toda la idea puede verse en esa figura, donde 2 veces la 
columna 1 se suma a 3 veces la columna 2. Geométricamente, así se obtiene un famoso pa- 
ralelogramo. Algebraicamente, se obtiene el vector correcto (1, 5), en el miembro derecho . 
de las ecuaciones. La representación por columnas confirma que x = 2 y y = 3. E 

Puede dedicarse más tiempo a este ejemplo, aunque se prefiere pasar al caso en que ¿ 
n = 3. Tres ecuaciones siguen siendo manipulables, y presentan mucha mayor variedad: 


TER DS SO . 
Tres planos 4u — 6u AL (1) : 
4 +7T0+2w= 9. E 


De nuevo, es posible estudiar los renglones o las columnas, de modo que se empieza con los 
renglones. Cada ecuación describe un plano en tres dimensiones. El primer plano es 2u + 
v + w= 5, y se muestra en la figura 1.3. Contiene a los puntos (3 ,0,0)y(0,5,0)y(0,0, “ 
5). Es determinado por cualesquiera tres de sus puntos, suponiendo que no son colineales. 

Al cambiar 3 a 10, el plano 2u + v + w = 10 debe ser paralelo al anterior. Contie- 
ne a (3, 0, 0) y (0, 10, 0), y (0, O, 10) que está dos veces más lejos del origen, que es el 
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+v+u=5 (plano inclinado) | 


| du — 6u =-2 (plano vertical) 


Ñ 


(1,1,2) = punto de intersección con 
el tercer plano = solución 






línea de intersección: 
u los dos primeros planos 


Figura 1.3 La representación por renglón: tres planos que se cortan, provenientes de tres 
ecuaciones lineales. 


punto central y = 0, v = O, w = 0. Al cambiar el miembro derecho, el plano paralelo se 
mueve a sí mismo, y el plano 24 + v + w = 0 pasa por el origen. 

El segundo plano es 4u — 6v = —2. Se trazó verticalmente porque w puede asumir 
cualquier valor. El coeficiente de w es cero, aunque sigue siendo un plano en el espacio 
tridimensional. (La ecuación 4u = 3, o incluso el caso extremo u = 0, sigue describien- 
do un plano.) En la figura se muestra la intersección del segundo plano con el primero. 
Esta intersección es una recta. En tres dimensiones, una recta requiere dos ecuaciones; en 
n dimensiones requiere n — 1. 

Finalmente, el tercer plano corta a la recta en un punto. El plano (no está dibujado) 
representa la tercera ecuación, —2u + Tv + 2w = 9, y corta a la recta en u = 1l,v= 1, 
w = 2. Este punto de intersección triple (1, 1, 2) resuelve el sistema lineal. 

¿Cómo se extiende hasta n dimensiones esta representación por renglones? Las n ecua- 
ciones contienen n incógnitas. La primera ecuación sigue determinando un “plano”, que ya 
no es un plano bidimensional en el espacio tridimensional; de alguna manera, su “dimen- 
sión” es n — 1. Debe ser plano y extremadamente delgado en un espacio n-dimensional, 
aunque nos parezca sólido. 

Si el tiempo es la cuarta dimensión, entonces el plano £ = O corta al espacio tetradimen- 
sional y produce el universo tridimensional en que vivimos (o más bien, el universo como 
era en 1 = 0). Otro plano es z = O, que también es tridimensional; se trata del plano normal 
x-y que se considera todo el tiempo. ¡Estos espacios tridimensionales se cortan! Comparten 
el plano normal x-y en 1 = O. Si se desciende a dos dimensiones, el siguiente plano deja una 
recta. Por último, un cuarto plano deja un solo punto. Se trata del punto de intersección de 
4 planos en 4 dimensiones, y resuelve las 4 ecuaciones subyacentes. 

Si continuamos con este ejemplo proveniente de la relatividad, estaremos en proble- 
mas. La cuestión es que el álgebra lineal es capaz de operar con cualquier número de ecua- 
ciones. La primera ecuación produce un plano (n — 1) dimensional en n dimensiones. El 
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segundo plano lo corta (esperamos) un conjunto más pequeño de “dimensión n — 2”. Su- 
poniendo que todo va bien, todo plano nuevo (toda ecuación nueva) reduce la dimensión 
en una unidad. Al final, cuando se hayan tomado en cuenta todos los n planos, la dimen- 
sión de la intersección es cero. Se trata de un punto, que pertenece a todos los planos, y sus 
coordenadas satisfacen a todas las n ecuaciones. ¡Ésta, es la solución! 


Vectores columna y combinaciones lineales 


Ahora volvemos a las columnas. Esta vez la ecuación vectorial (la misma ecuación que (1)) 
es 


2 Al 1 5 
Forma de columna ut 4l+viól +wj0! = 2 =» (2) 
A 


Estos son vectores columna tridimensionales. El vector b se identifica con el punto cuyas 
coordenadas son 5, —2, 9. Todo punto en el espacio tridimensional se hace corresponder 
con un vector, y viceversa. Ésta, era la idea de Descartes, quien transformó la geometría en 
álgebra al trabajar con las coordenadas del punto. Es posible escribir el vector en una co- 
lurana, o sus componentes pueden enumerarse como b = (3, —2, 9), o incluso puede re- 
presentarse geométricamente mediante una flecha a partir de su origen. Pueden elegirse la 
Flecha, o el punto o los tres números. En seis dimensiones, quizá es más conveniente ele- 
gir los seis números. 

Cuando los componentes se enumeran horizontalmente, suele utilizarse paréntesis y 
comas, y cuando el vector columna se indica verticalmente se usan llaves (sin comas). Lo 
que realmente importa es la suma de vectores y la multiplicación por un escalar (un nú- 
mero). En la figura 1.4a se muestra una suma vectorial, componente por componente: 



















: 3 0 0 S 
Suma vectorial 01 + |(-2| + 0] = [-2]. 
0 0 9 9 
3 
cd —2| = combinación lineal = b 
9 
2 d 
0| =2]0 
4 2 
2 (columna 3) 
2 1 3 
4|+|-6| =|-2 
—2 7 ps 
columnas 1 + 2 
a) Los vectores se suman a b) Se suman las columnas 1 + 2 + (3+ 3) 


lo largo de los ejes 


Figura 1.4 La representación por columna: la combinación lineal de las columnas es 
igual a b. | 
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En la figura de la' diddnd had una Enea por 2 (y si el vector hubiese sido multi- 


plicado por —2, entonces el vector hubiera invertido su dirección): 


1 2 da —2 
Multiplicación por escalares 2101 = ¡0l, 2/0] = | Ol. 
2 A Z —á4 


También en la figura de la derecha se observa una de las ideas centrales del álgebra. 
Utiliza las dos Operaciones básicas: los vectores se multiplican por números y luego se su- 
man. El resultado se denomina combinación lineal, y esta combinación resuelve nuestra 
ecuación: 


2 1 1 s 
Combinación lineal  — 1| 4i +1 |-6]| +2 |0| = |-21. 
—2 q 2 9 


La ecuación (2) requirió multiplicadores u, v, w, que producen el miembro derecho b. Estos 
números son u = 1, y = 1, w = 2, Y proporcionan la combinación correcta de las colum- 
nas. También proporcionaron el punto (1, 1, 2) en la representación por renglón (donde se 
cortan los tres planos). 

Nuestro verdadero objetivo es ir más allá de dos o tres dimensiones, hasta n dimensio- 
nes. Con n ecuaciones en n incógnitas, en la representación por renglón hay n planos. En 
la representación por columna hay n vectores, más un vector b en el miembro derecho. La 
ecuación pide una combinación lineal de las n columnas que sea igual a b. Para ciertas 
ecuaciones esto es imposible. Paradójicamente, la mejor manera de entender el caso bue- 
no es estudiando el caso malo. Por consiguiente, consideraremos la geometría, justo cuan- 
do falla, en el caso singular. 









Representación por renglón: intersección de planos 
Representación por columna: combinación de columnas 


El caso singular 


Suponga que nuevamente estamos en tres dimensiones, y que tres planos en la representa- 
ción por renglón no se cortan. ¿Qué puede estar mal? Una posibilidad es que dos planos 
pueden ser paralelos. Las ecuaciones 24 + y + w= 5 y 4u + 2v + 2w = 11 son inconsis- 
tentes, y planos paralelos no dan solución (en la figura 1.5a se muestra una vista del extre- 
mo). En dos dimensiones, la Única posibilidad de falla la constituyen las rectas paralelas. Sin 
embargo, tres planos en tres dimensiones pueden estar en problemas sin ser paralelos. 

La dificultad más frecuente se muestra en la figura 1.5b. A partir de la vista del ex- 
tremo, los planos forman un triángulo. Cada par de planos se corta en una recta, y estas 


DAR NÑ 


dos planos no hay recta de todos los planos 
paralelos intersección intersección son paralelos 
a) b) c) d) 


Figura 1.5 Casos singulares: no hay solución para a), b), o d), una infinidad de solucio- 
nes para Cc). 
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rectas son paralelas. El tercer plano no es paralelo a los otros planos, pero es paralelo a su 
línea de intersección. Esto corresponde a un sistema singular con b = (2, 5, 6): 


u+s+v+ w=2 
No hay soluciones, como en la figura 1.5b  2u +3w=5 (3) 
B3u + v.+4w =6. 


Sumados, los dos primeros miembros izquierdos son iguales al tercero. En el miembro de- 
recho falla eso: 2 + 5 4 6.La ecuación 1 menos la ecuación 2 menos la ecuación 3 es la 
afirmación imposible O = 1. Así, las ecuaciones son inconsistentes, como la eliminación 
gaussiana descubre sistemáticamente. 

Otro sistema singular, próximo a éste, tiene una infinidad de soluciones. Una vez que 
el 6 en la última ecuación se vuelve 7, las tres ecuaciones se combinan para dar O = 0. Así, 
la tercera ecuación es la suma de las dos primeras. En ese caso, los tres planos tienen toda 
una recta en común (véase la figura 1.5c). Al cambiar los miembros derechos, los planos 
de la figura 1.5b se moverán en sentido paralelo a sí mismos, y para b = (2, 5, 7), repenti- 
namente la figura es diferente. El plano inferior se movió para encontrar a los otros, y hay 
una recta de soluciones. El problema 1.5c sigue siendo singular, pero ahora adolece de de- 
masiadas soluciones, en vez de tener unas cuantas. 

El caso extremo lo constituyen tres planos paralelos. Para la mayor parte de miembros 
derechos no hay solución (véase la figura 1.5d). Para miembros derechos especiales (¡co- 
mo b = (0, O, 0)!), hay todo un plano de soluciones, ya que los tres planos paralelos se mue- 
ven para convertirse en el mismo. 

¿Qué ocurre con la representación por columna cuando el sistema es singular? Debe 
estar mal, aunque la pregunta es cómo. En el miembro izquierdo de las ecuaciones sigue ha- 
biendo tres columnas, y se intenta combinarlas para obtener b. Se queda con la ecuación (3): 


Caso singular: representación por columna 1 1 1 
Tres columnas en el mismo plano u|2| +v|0| +w]|3| =5. (4) 
Fácil de resolver sólo para 5b en ese plano 3 1 4 


Para b = (2, 5, 7) era posible esto; para b = (2, 5, 6) no lo era. La razón de esto es que es- 
tas tres columnas están en un plano. Entonces cualquier combinación también está en el 
plano (que pasa por el origen). Si el vector b no está en ese plano, ninguna solución es po- 
sible (véase la figura 1.6). Éste es por mucho el evento más probable; un sistema singular 







3 columnas 
en un plano 


| 3 columnas 
bno está ¡en un plano 
en el plano 


o 1 





a) no hay solución b) infinidad de soluciones 


Figura 1.6 Casos singulares: b fuera o dentro del plano con todas las tres columnas. 
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en general no tiene solución. Sin embargo, hay una posibilidad de que b esté en el plano 
de las columnas. En ese caso hay demasiadas soluciones; las tres columnas pueden com- 
binarse en una infinidad de formas para producir b. Esa representación por columna de 
la figura 1.6b corresponde a la representación por renglón de la figura 1.5c. 

¿Cómo se puede saber que las tres columnas están en el mismo plano? Una respuesta 
consiste en encontrar una combinación de las columnas cuya suma sea cero. Después de al- 
gunos cálculos, esta combinación es u = 3, v = —1, w = —2. Tres veces la columna 1 es 
igual a dos veces la columna 2 más dos veces la columna 3. La columna 1 está en el plano 
de las columnas 2 y 3. Sólo dos columnas son independientes. 

El vector b = (2, 5, 7) está en ese plano de las columnas: es la columna 1 más la co- 
lumna 3, de modo que (1, O, 1) es una solución. Es posible sumar cualquier múltiplo de la 
combinación (3, —1, —2) que produzca b = 0. Así, hay toda una recta de soluciones, co- 
mo se sabe a partir de la representación por renglón. 

La verdad es que se sabía que las columnas deben combinarse para obtener cero, ya 
que eso ocurría con los renglones. Este hecho pertenece a las matemáticas, no a los cálcu- 
los, y sigue siendo verdadero en la dimensión n. Si los n planos no tienen ningún punto 
en común, o comparten una infinidad de puntos, entonces las n columnas están en el 
mismo plano. 

S1 la representación por renglón falla, entonces también falla la representación por co- 
lumna. Esto hace la diferencia entre el capítulo 1 y el capítulo 2. En el capítulo 1 se estudia 
T el problerna más importante: el caso no singular, donde hay una solución que es necesario 
encontrar. En el capítulo 2 se estudia el caso general, donde puede haber muchas soluciones 
o ninguna. En ninguno de estos dos casos es posible continúar sin tener una notación (nota- 
ción matricial), y un algoritmo (eliminación) idóneos. Después de los siguientes ejercicios 
se abordará la eliminación. 





RISAS EIA 








E Conjunto de problemas 1.2 


1. Para las ecuaciones x + y = 4, 2x — 2y = 4, trace la representación por renglón (dos 
rectas que se cortan), y la representación por columna (combinación de dos columnas 
igual al vector columna (4, 4) en el miembro derecho). 


2. Resuelva lo siguiente para encontrar una combinación de las columnas que sea igual a bh: 
U—v=wW=bj 
Sistema triangular v+w=ba 
Y = bx. 
3. (Recomendado) Describa la intersección de los tres planos u + v+ w+z=6yu + 
wW+z=4yu+ ww = 2 (todos en el espacio tetradimensional). ¿Es una recta, un pun- 
to o un conjunto vacío? ¿Cuál es la intersección si se incluye el cuarto plano u = —1?7 
Encuentre una cuarta ecuación que deje la situación sin solución. 


4. Trace las tres rectas siguientes, y decida si las ecuaciones son de fácil solución: 


x+r2y=2 
Sistema de 3 por2 x-— y=2 
y =1. 


¿Qué ocurre si todos los miembros izquierdos son cero? ¿Hay alguna opción diferen- 
te de cero de miembros derechos que permita que las tres rectas se cortan en el mismo 
punto? 





5. Encuentre dos puntos en la recta de intersección de los tres planos 1 = Oyz=0y 
x+yw+z+t=]lemnel espacio de 4 dimensiones. 


NS 
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6. 


eli 


10. 


11. 


12. 


Cuando b = (2, 5, 7), encuentre una solución (u, v, w) de la ecuación (4) distinta de 
la solución (1, O, 1), mencionada en el texto. 


Proporcione dos miembros derechos más, aparte de b = (2, 5, 7) para los cuales la 
ecuación (4) pueda resolverse. Proporcione dos miembros derechos más, aparte de 
b = (2, 5, 6) para los cuales la ecuación (4) no pueda resolverse. 
Explique por qué el sistema 
u + .+v=2 
u +2u + 3w=1 
v+2w=0 


es singular, encontrando una combinación de las tres ecuaciones que produzca O = 1. 
¿Qué valor debe sustituirse en el último cero del miembro derecho para que las ecua- 
ciones tengan soluciones, y cuál es una de las soluciones? 


La representación por columna del ejercicio anterior (sistema singular) es 


1 1 1 
u lll +v12l| +w13| =02. 
0 1 2 


Demuestre que las tres columnas de la izquierda están en el mismo plano, expresando 
la tercera columna como una combinación de las dos primeras. ¿Cuáles son las solu- 
ciones (u, v, w) si b es el vector cero (0, O, 0)? 


(Recomendado) ¿Bajo qué condición sobre yy, ya, Y3 los puntos (0, y1), (1, y2), (2, y3) 
están en una línea recta? 


Es cierto que la solución de las siguientes ecuaciones es x = y = O, ¿Para qué valores 
de a hay toda una recta de soluciones? 

ax +2y=0 

2x +ay=0 


Empezando con x + 4y = 7, encuentre la ecuación de la recta paralela que pasa por 
x = 0, y = O, Encuentre la ecuación de otra recta que corta a la primera en x = 3, y = 1. 


Los problemas 13 a 15 son un repaso de las representaciones por renglón y por 
columna. 


ie 
14. 


ES. 


16. 


Trace las dos representaciones en dos planos para las ecuaciones x-— 2y = 0,x + y = 6. 


Para dos ecuaciones lineales en tres incógnitas x, y, z, la representación por renglón 
muestra (2 o 3) (rectas O planos) en un espacio (bi o tri) dimensional. La representa- 
ción por columna es en un espacio (bi o tri) dimensional. Las soluciones normalmen- 
te están en un 


Para cuatro ecuaciones lineales en dos incógnitas x y y, la representación por renglón 
muestra cuatro . La representación por columna está en un espacio di- 
mensional. Las ecuaciones no tienen solución, a menos que el vector del miembro de- 
recho sea una combinación de 





Encuentre un punto con z = 2 en la recta de intersección de los planos x + y + 3z = 
6 y x— y + z= 4. Encuentre el punto con z = O y un tercer punto a la mitad entre los 
dos puntos anteriores. 
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17. La primera de las siguientes ecuaciones más la segunda es igual a la tercera: 
o, o A E 
PELOTA AS 
LTD HZ SD. 
Los dos primeros planos se encuentran a lo largo de una recta. El tercer plano contie- 
ne a esta recta, ya que si x, y, z satisfacen las dos primeras ecuaciones, entonces tam- 


bién . Las ecuaciones tienen una infinidad de soluciones (toda la recta IL). En- 
cuentre las tres soluciones. 


18. Mueva el tercer plano en el problema 17 hasta un plano paralelo 2x + 3y + 2z = 9, 
Ahora, las tres ecuaciones no tienen solución; ¿por qué? Los dos primeros planos se 
encuentran a lo largo de la recta L, pero el tercero no esa recta. 





19, En el problema 17, las columnas son (1, 1, 2) y (1, 2, 3) y (1, 1, 2). Este es un “caso sin- 
gular” porque la tercera columna es . Encuentre dos combinaciones de las colum- 
nas que proporcionen b = (2, 3, 5). Esto sólo es posible para b = (4, 6,c) sic = 








20. Normalmente, 4 “planos” en el espacio tetradimensional se cortan en un . Nor- 
malmente, 4 vectores columna en el espacio de 4 dimensiones pueden combinarse pa- 
ra producir b, ¿Qué combinación de (1, 0, O, 0), (1, 1, 0, 0), (1, 1, 1, 0), (1, 1, 1, 1) pro- 
duce b = (3, 3,3, 2)? ¿Cuáles son las 4 ecuaciones que está resolviendo para x, y, z, 1? 


21. Cuando la ecuación 1 se suma a la ecuación 2, ¿cuál de las siguientes opciones cam- 
bia: los planos en la representación por renglón, la representación por columna, la ma- 
triz de coeficientes, la solución? 


22. Si (a, b) es un múltiplo de (c, d) con abcd % O, demuestre que (a, c) es un múltiplo de 
(b, d). Esto es sorprendentemente importante: denomínela pregunta de desafío. Primero 
puede usar números para ver cómo están relacionados a, b, c y d. La pregunta lleva a: 


Si A = E el tiene renglones dependientes, entonces tiene columhñas dependientes. 


23. En estas ecuaciones, la tercera columna (que multiplica a w) es la misma que el miem- 
bro derecho b. La forma en columna de las ecuaciones, ¿qué solución para (1, uv, w) 
proporciona de inmediato? 

6u + Tv + 8w = 8 
4u + Su + 9w =9 


2u — 2u + Tw =7. 





1.3 UN EJEMPLO DE ELIMINACIÓN GAUSSIANA 


La forma de entender la eliminación es por medio de un ejemplo. Se empieza en tres di- 
mensiones: 


Zu vt+tvw= 5 
Sistema original 4u — Óv = —2 (de) 
—24 + Tu +2w= 9 


El problema consiste en encontrar los valores incógnitos de u, uv, y w, de modo que se 
aplicará eliminación gaussiana. (Gauss es reconocido como el más grande de los matemá- 
ticos, aunque no ciertamente debido a este invento, que quizá le llevó 10 minutos. Irónica- 
mente, es el concepto más frecuentemente utilizado que lleva su nombre.) El método ern- 
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pieza por restar múltiplos de la primera ecuación a las otras ecuaciones. El objetivo es 
eliminar u de las dos últimas ecuaciones. Para lograr este objetivo se requiere lo siguien- 
te: 

a) restar 2 veces la primera ecuación de la segunda 

b) restar —1 vez la primera ecuación de la tercera. 


2Zu + U+ yw=o 5 
Sistema equivalente 81 2 = =12 (2) 
8vuv +3w= 14. 


El coeficiente 2 es el primer pivote. La eliminación consiste en dividir constantemente el 
primer pivote entre los números que están abajo de él, con la finalidad de encontrar los mul- 
tiplicadores idóneos. 

El pivote de la segunda etapa de la eliminación es -8. Ahora se ignora la primera 
ecuación. Un múltiplo de la segunda ecuación se restará de las ecuaciones que quedan (en 
este caso sólo queda la tercera) con la finalidad de eliminar v. La segunda ecuación se su- 
ma a la tercera o, en otras palabras, 


c) se resta —1 vez la segunda ecuación de la tercera. 


Ahora el proceso de eliminación está completo, por lo menos en la dirección “hacia ade- 
lante”: 


Zu + v+ w= hos 
Sistema triangular —81 — 2w = -12 (3) 
lw = JA 


Este sistema se resuelve hacia atrás, de abajo arriba. La última ecuación da w = 2. Al 
sustituir en la segunda ecuación, se encuentra v = 1. Luego, la primera ecuación da u = 1. 
Este proceso se denomina sustitución hacia atrás. 

Para repetir: con la eliminación hacia adelante se obtuvieron los pivotes 2, —8, 1. En 
este método se restan múltiplos de cada renglón de los renglones de abajo para Hlegar al sis- 
tema “triangular” (3), que se resuelve en orden inverso. Luego, cada nuevo valor calcula- 
do se sustituye en las ecuaciones restantes. 


Observación Una forma aceptable de escribir los pasos de la eliminación hacia adelante 
es incluir el miembro derecho como una columna adicional. No es necesario copiar u y y 
y w y = en cada paso, por lo que se trabaja con lo mínimo indispensable: 


Z 1 1 y z 1 1 5 2 l 1 A, 
4 —6 0 —21>]0 -8 -2 -—-12| +0 —8 —2 -12]. 
2, 7 2 9 0 8 3 14 0 0 1 2 


Al final se llega al sistema triangular, que ya está listo para la sustitución hacia atrás. Qui- 
zá el lector prefiera esta disposición, que garantiza que las operaciones en el miembro iz- 
quierdo de la ecuación también se realizan en el miembro derecho, ya que ambos miem- 
bros están juntos ahí. 


En un problema más grande, la eliminación hacia adelante requiere más esfuerzo. Se 
usan múltiplos de la primera ecuación para producir ceros abajo del primer pivote. Luego, 
la segunda columna se limpia abajo del segundo pivote. El paso hacia adelante se finaliza 
cuando el sistema es triangular; la ecuación n sólo contiene a la última incógnita multipli- 
cada por el último pivote. 


rd 
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e 


img. PLAZINAS dal J A EL URUGUAR 
La sustitución hacid MER plodilce la solucione í cohiplera en orden opuesto: se empieza con 
la última incógnita, luego se resuelve de la siguiente hasta la última, terminando con la 
primera. 
Por definición, los pivotes no pueden ser cero. Es necesario dividir entre ellos. 


La falla de la eliminación 


¿En qué circunstancias es posible que falle el proceso? Algo debe estar mal en el caso 
singular, y algo puede estar mal en el caso no singular. Esto podría parecer algo prematu- 
ro; después de todo, apenas se ha logrado tener funcionando al algoritmo. Sin embargo, la 
posibilidad de falla ilumina al método en sí, 

La respuesta es: con un conjunto conipleto de n pivotes, sólo hay una solución. El sis- 
tema es no singular, y se resuelve por eliminación hacia adelante y sustitución hacia atrás. 
Pero si en una posición pivote aparece un cero, es necesario detener la eliminación, ya sea 
temporal o permanentemente. El sistema puede o no ser singular. 

Si el primer coeficiente es cero, en la esquina superior izquierda, la eliminación de u 
de las otras ecuaciones es imposible. Lo mismo es cierto en toda etapa intermedia. Obser- 
ve que en una posición pivote puede aparecer un cero, aun si el coeficiente original en ese 
sitio no era cero. En términos generales, no se sabe si aparecerá un cero sino hasta que 
se intenta, al realizar en verdad el proceso de eliminación. 

En muchos casos este problema puede restablecerse, por lo que la eliminación puede 
continuar. Un sistema así sigue siendo no singular; es sólo el algoritmo lo que requiere re- 
paración. En otros casos es inevitable la falla. Estos sistemas incurables son singulares; no 
tienen solución o tienen una infinidad de éstas, por lo que no es posible encontrar un con- 
junto completo de pivotes. 


No singular (restablecido al intercambiar las ecuaciones 2 y 3) 


Ut UU w=__ HF UP? U=>, Ut ut w=>__ 
2u +2lutów=_ — BAS... 2u+4w=__ 
4u + 6v + 8w = 2vu+4w=__ Bu >= 


El sistema es triangular, y puede resolverse con sustitución hacia atrás. 


Singular (caso incurable) 


Ut U+tFuw=__ UF V+wW=__ 
Zu +F2u+t+t5W=_ ”— US 
4u + 4u + 8w = dá =__ 


No existe ningún intercambio de ecuaciones que pueda evitar el cero en la segunda posi- 
ción pivote. Las ecuaciones mismas pueden ser o no fáciles de resolver. Si las dos últimas 
ecuaciones son 3w = 6 y 4w = 7, no hay solución. Si ocurre que estas dos ecuaciones son 
consistentes, como con 3w = 6 y 4w = 8, entonces este caso singular tiene una infinidad 
de soluciones. Se sabe que w = 2, pero la primera ecuación no puede decidir ambas u y Y. 

En la sección 1.5 se abordarán los intercambios de renglón cuando el sistema es no 
singular. Así, los intercambios producen un conjunto completo de pivotes. En el capítulo 2 
se estudia el caso singular. El 3w aún puede eliminar a 4w, por lo que el segundo pivote es 
3. (No habrá un tercer pivote). Por ahora se confía en que todos los 1 elementos pivote son 
diferentes de cero, sin cambiar el orden de las ecuaciones. Éste es el mejor caso, que será 
continuado. 


A A gu A A a O o a A TA E, A del ANA 


a o a 
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El costo de la eliminación 


La otra pregunta es muy práctica. ¿Cuántas operaciones aritméticas requiere la elimina- 
ción para n ecuaciones en n incógnitas? Sin es grande, una computadora puede realizar 
el proceso de eliminación. Debido a que se conocen todos los pasos, debe ser posible po- 
der pronosticar el número de operaciones. 

Por el momento se ignorarán los miembros derechos de las ecuaciones, y sólo se con- 
tarán las operaciones a la izquierda. Estas operaciones son de dos clases. Se divide entre el 
pivote para encontrar qué múltiplo (por ejemplo £) de la ecuación pivote debe restarse. Una 
vez que se realiza esta sustracción, continuamente se encuentra una combinación “multipli- 
car-restar”; los términos de la ecuación pivote se multiplican por £, y luego se restan de otra 
ecuación. 

Suponga que cada división, y cada multiplicación-sustracción se denomina una ope- 
ración. En la columna 1, se requieren n operaciones por cada cero que se obtiene: una pa- 
ra encontrar el múltiplo £, y la otra para encontrar los nuevos elementos a lo largo del 
renglón. Abajo del primer renglón hay n — 1 renglones, de modo que la primera etapa de la 
eliminación requiere n(n — 1) = n? — n operaciones. (Otra forma de llegar a n? — n es ésta: 
es necesario cambiar todos los n? elementos, excepto los n en el primer renglón). Las eta- 
pas posteriores son más rápidas porque las ecuaciones son más cortas. 

Cuando la eliminación se realiza con k ecuaciones, para limpiar la columna que está aba- 
jo del pivote se requieren sólo X* — k operaciones, por el mismo razonamiento que se aplicó 
en la primera etapa, cuando k era igual a n. Al reunir todo lo anterior, se encuentra que el nú- 
mero total de operaciones es la sumatoria de kx? —k sobre todos los valores k desde 1 hasta n: 


nía + DQn +1) E nín +1) 


Miembro izquierdo 12 +--++n?%)—(1+-++ +n) = , - 


Estas fórmulas son normales para encontrar las sumatorias de los n primeros números y los 
n primeros cuadrados. Al sustituir n= 1 yn =2 yn = 100 en la fórmula 3 (1? — nm), la eli- 
minación hacia adelante puede no requerir ningún paso, requerir dos pasos o requerir alre- 
dedor de un millón de pasos: 


St n no es grande en absoluto, una buena estimación para 
el número de operaciones es Ln3. 






Si el tamaño se duplica, y pocos de los coeficientes son cero, entonces el costo se multipli- 
ca por 8. 

La sustitución hacia atrás es considerablemente más rápida. La última incógnita se en- 
cuentra en sólo una operación (una división entre el último pivote). Para encontrar la ante- 
penúltima incógnita se requieren dos operaciones, y así sucesivamente. Entonces, el total 
para la sustitución hacia atrás es 1 +2 +---+m. 

La eliminación hacia adelante también actúa sobre el miembro derecho (restando los 
mismos múltiplos que en la izquierda con la finalidad de preservar las ecuaciones correc- 
tas). Empieza con n — 1 sustracciones de la primera ecuación. Junto con el miembro dere- 
cho es responsable de n? operaciones: mucho menos que las n*/3 a la izquierda. El total 
para la eliminación hacia adelante y la sustitución hacia atrás es 


Miembro derecho — [(n—1)+(n-2)+--*-+1]+[1+2+---+n] =n?. 


Hace 30 años, casi cualquier matemático hubiera conjeturado que un sistema general 
de orden n no podía resolverse con mucho menos que n*/3 multiplicaciones. (Incluso ha- 
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bía teoremas para demostrarlo, aunque no tomaban en cuenta a todos los métodos posibles). 
Sorprendentemente, se ha demostrado que esa conjetura es errónea. ¡En la actualidad exis- 
te un método que requiere sólo Cn!e27 multiplicaciones! Depende de un simple hecho: pa- 
rece que dos combinaciones de dos vectores en el espacio bidimensional requieren 8 multi- 
plicaciones, aunque es posible hacerlas en 7. Lo anterior redujo el exponente de log, 8, que 
es 3, alog, 7 = 2.8. Este descubrimiento provocó bastante actividad para encontrar la po- 
tencia mínima posible de n. El exponente finalmente cayó (en IBM) debajo de 2.376. Afor- 
tunadamente para la eliminación, la constante C es tan grande y el código es tan difícil que 
el nuevo método es bastante (o completamente) interesante desde el punto de vista teórico. 
El problema más reciente es el costo con muchos procesadores en paralelo. 


Conjunto de problemas 1.3 
Los problemas 1 a 9 son sobre eliminación en sistemas de 2 por 2. 
1. ¿Qué múltiplo de £ de la ecuación 1 debe restarse de la ecuación 2? 
2x +3y=1 
10x + 9y = 11. 


Después de este paso de eliminación, escriba el sistema triangular superior e identifi- 
que los dos pivotes. Los números 1 y 11 no afectan tales pivotes. 


2. Resuelva por sustitución hacia atrás el sistema triangular del problema 1, y antes que x. 
Compruebe que x multiplicado por (2, 10) más y por (3, 9) es igual a (1, 11). Si el 
miembro derecho cambia a (4, 44), ¿cuál es la nueva solución? 


3. ¿Qué múltiplo de la ecuación 2 debe restarse de la ecuación 3? 
2x —4y=6 
ox +5y=0. 
Después de este paso de eliminación, resuelva el sistema triangular. Si el miembro de- 
recho cambia a (—6, 0), ¿cuál es la nueva solución? 
4. ¿Qué múltiplo de £ de la ecuación 1 debe restarse de la ecuación 2? 
ax +by=f 
cx +dy =g. 
El primer pivote es a (se supone que es cero). ¿Qué fórmula para el segundo pivote pro- 


duce la eliminación? ¿Qué es y? El segundo pivote falta cuando ad = bc. 


5. Escoja un miembro derecho que no proporcione ninguna solución, y un miembro de- 
recho que no proporcione una infinidad de soluciones. ¿Cuáles son dos de estas solu- 
ciones? 

3x+2y=10 
Óx +4y = 


6. Escoja un coeficiente b que haga singular este sistema. Luego, escoja un miembro de- 
recho g que lo haga fácil de resolver. Encuentre dos soluciones en ese caso singular. 


2x +by=16 
4x +8y = g. 


$ 


Y y 
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7. ¿Para qué números a la eliminación falla a) permanentemente, y b) temporalmente? 
(1h Mn a y 
4x+6y= 6. 

Resuelva para x y y después de fijar la segunda falla por un intercambio de renglón. 


8. ¿Para cuáles tres números k falla la eliminación? ¿Cuál es fijada por un intercambio 
de renglón? En cada caso, el número de soluciones, ¡es 0o 1 o 00? 





kx+3y= 6 
3 +Hky = =Ó0. 
9. ¿Qué prueba sobre b, y b, decide si estas dos ecuaciones permiten una solución? A 


¿Cuántas soluciones tienen? Trace la representación por columna. A 
eo 2y =b 1 
6x — 4y = ba. 


Los problemas 10 a 19 estudian la eliminación en sistemas de 3 por 3 (y la falla 
posible). 





id 
(SM ¡RICAS 


4x + Ty +32 =20 
2 A 0 


Identifique los pivotes. Resuelva por sustitución hacia atrás para z, y, X. 


10. Reduzca el siguiente sistema a forma triangular superior, mediante dos operaciones en E 
renglones: E 

E 

E E > po 


11. Aplique eliminación (identifique los pivotes) y sustitución hacia atrás para resolver 
Pd yl = 3 
AA AA 
24 ON it Ed 


Enumere las tres Operaciones en renglones: Restar 
renglón 


veces el renglón del 








12. ¿Cuál número d obliga a un intercambio de renglón, y cuál es el sistema triangular (no 
singular) para ese d? ¿Cuál d hace singular a este sistema (no el tercer pivote)? 
EFI SO 
4x +dy+z= 
y-=2z=3. 

13, ¿Cuál número d lleva posteriormente a un intercambio de renglón? ¿Cuál número b 
lleva posteriormente a un pivote faltante? En ese caso singular, encuentre una solu- 
ción x, y, z diferente de cero. 

x +by = ( 
A 
Yy+z= 0 


l 
O 
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a) Escriba un sistema de 3 por 3 que requiera dos intercambios de renglones para al- 
canzar una forma triangular, y una solución. 

b) Escriba un sistema de 3 por 3 que requiera un intercambio de renglones para fun- 
cionar, y que falle después. 


Si los renglones 1 y 2 son los mismos, ¿hasta dónde es posible llegar con la elimina- 
ción (permitiendo intercambio de renglones)? Si las columnas 1 y 2 son las mismas, 
¿cuál pivote falta? 


Ye o E Y, 2x +2y+2z2=0 
2x-“y+z=0 4x +4y+z2=0 
dx +y+z=2 6x +6y +27 =2. 


Escriba un ejemplo de 3 por 3 que tenga 9 coeficientes distintos en el miembro izquier- 
do, pero que los renglones 2 y 3 se vuelvan cero en la eliminación. ¿Cuántas solucio- 
nes tiene este sistema con b = (1, 10, 100), y cuántas tiene con b = (0, 0, 0)? 


¿Cuál número q hace singular al siguiente sistema, y con qué miembro derecho ! el sis- 
tema tiene una infinidad de soluciones? Encuentre la solución que tiene z = 1. 


x+4dy—?2z=1 
EPIYV AF Ó2 26 
INF IZ E 
(Recomendado) Es imposible que un sistema de ecuaciones lineales tenga exactamen- 
te dos soluciones. Explique por qué. 


a) Sí (x, y, 2) y (X, Y, Z) son dos soluciones, ¿cuál es otra? 
b) Si 23 planos se encuentran en dos puntos, ¿dónde más se encuentran? 


Puede ocurrir que tres planos fallen en tener un punto de intersección, cuando ningún 
par de ellos es paralelo. El sistema es singular si el renglón 3 de A es una de los 
primeros dos renglones. Encuentre una tercera ecuación que no sea posible resolver si 
xt+ty+z2=0yx-2y)-z=1l. 





En los problemas 20 a 22 se abordan sistemas de 4 por 4, y de n por n. 


20. 


21. 


22. 


Encuentre los pivotes, y las soluciones de las cuatro siguientes ecuaciones: 
ZE HE SY =0 
a =0 
y+22>+ 1£1=0 
DAL RO 


Si el problema 20 se extiende siguiendo el patrón 1, 2, 1 o el patrón -1, 2, —1, ¿cuál 
es el quinto pivote? ¿Cuál es el n-ésimo pivote? 


Aplique eliminación y sustitución hacia atrás para resolver 
ZU 30 = 0 


du +5 + w=3 
2u — uv—3w =8,. 


¿Cuáles son los pivotes? Enumere las tres operaciones en las que el múltiplo de un 
renglón se resta de otro renglón. 
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23. 


24 


26. 


27. 


Para el sistema 


UE A AS 

u +3u+3w=0 

u +3u + 5w = 2, 
¿Cuál es el sistema triangular después de la eliminación hacia adelante, y cuál es la so- 
lución? 


Resuelva el siguiente sistema, y encuentre los pivotes cuando 


2u == Y = Q 
=4u +2u— w = 0 
E TRA =0 

—=w + 2z =5, 


Es posible llevar el miembro derecho como una quinta columna (y así omitir escribir 
u, v, w, z hasta la solución al final). 


Aplique eliminación al sistema 


u+ v+w=-=-2 
Bu +3 w= 6 
u= v+w=-1. 


Cuando en la posición pivote aparezca un cero, intercambie esa ecuación por la que 
está abajo, y continúe, ¿Qué coeficiente de y en la tercera ecuación, en lugar del — 1 
actual, haría imposible continuar, y forzar a una falla en la eliminación? 


Resuelva por eliminación el siguiente sistema de ecuaciones 


A EL, 
3x + 6y = 18. 


Trace una gráfica que representa cada ecuación como una línea recta en el plano x — y; 
las rectas se cortan en la solución. También, agregue una recta más: la gráfica de una 
nueva segunda ecuación que aparece después de la eliminación. 


Encuentre tres valores de a para los cuales falle la eliminación, temporal o permanen- 
temente, en 


au + v=1 
4u + av =2. 


La falla en el primer paso puede establecerse intercambiando renglones, pero en el úl- 
timo paso no hay falla. 


Falso o verdadero: 

a) Si la tercera ecuación inicia con un coeficiente cero (empieza con Oz), entonces 
ningún múltiplo de la ecuación 1 se resta de la ecuación 3. 

b) Si el segundo coeficiente de la tercera ecuación es cero (contiene a 0v), entonces 
ningún múltiplo de la ecuación 2 se resta de la ecuación 3. 

c) Si la tercera ecuación contiene a Ou y a Ov, entonces ningún múltiplo de la ecuación 
l o de la ecuación 2 se resta de la ecuación 3. 





4 


ps 


e 





SER 


cer rd 
MEAN A 
pois 


OS 
A 


RIO 





1.4 Notación matricial y multiplicación de matrices 19 


29. (Bastante opcional). Normalmente la multiplicación de dos números complejos 
(a + ibKc + id) = [ac — bd) + i(bc + ad) 
implica las cuatro multiplicaciones por separado ac, bd, bc, ad. Ignorando a i, ¿puede 


calcular ac — bd y bc + ad con sólo tres multiplicaciones? (Puede realizar sumas, co- 
mo formar a + b antes de multiplicar, sin ninguna penalización.) 


30. Aplique eliminación para resolver 


u+ v+w= 6 u+ vt+w= 7 
u + 2 + 2w =1l y u +20 +2w= 10 
Zu +3 —4dw= 3 24 +3v—4dw= 3. 


31. ¿Para cuáles tres números a la eliminación fracasa en proporcionar tres pivotes? 


ax + 2y +3z=b, 
ax + ay + 4z = ba 
ax + ay + az = bx. 
32. Encuentre experimentalmente el tamaño medio (valor absoluto) de los pivotes prime- 


ro, segundo y tercero para MATLAB con lu(rand(3, 3)). El promedio del primer pi- 
vote a partir de abs(A(1, 1)) debe ser 0.5, 





1.4 NOTACIÓN MATRICIAL Y MULTIPLICACIÓN DE MATRICES 


Con el ejemplo de 3 por 3 es posible escribir por completo todas las ecuaciones. Es posible 
enumerar los pasos de la eliminación, los cuales restan un múltiplo de una ecuación a otra 
para llegar a una matriz triangular. Para un sistema grande, esta forma de mantener el rastro 
de la eliminación sería inútil; se requiere un registro mucho más conciso. 

A continuación se presenta la notación matricial para describir el sistema original, y 
la multiplicación de matrices para describir las operaciones que lo hacen más sencillo. 
Observe que en el ejemplo aparecen tres tipos distintos de cantidades: 

ZU IDE DS 


4u — Óv = —2 
—2u + Tv + 2w 9 


Nueve coeficientes 
Tres incógnitas 
Tres miembros derechos 


0 


En el miembro derecho está el vector columna b. En el miembro izquierdo están las incóg- 
nitas u, v, w. En el miembro izquierdo también están nueve coeficientes (de los cuales uno 
es cero). Resulta natural representar las tres incógnitas por medio de un vector: 


7) 1 
La incógnita es x = | y La solución es x = |1|. 
Y Ze 


Los nueve coeficientes están en tres renglones y tres columnas, con lo que se obtiene una 
matriz de 3 por 3: 


Matriz de coeficientes A = 4 —6 O |. 
2 q 2 


e ÑO mn 
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A es una matriz cuadrada, porque el número de ecuaciones es igual al número de incógni- 
tas. Si hay n ecuaciones en n incógnitas, se tiene una matriz cuadrada de n por n. De ma- 
nera más general, podría haber m ecuaciones y n incógnitas. En este caso, Á es rectangu- 
lar, con m renglones y n columnas. Se dice que es una “matriz de m por n”. 

Las matrices se suman entre sí, o multiplican por constantes numéricas, exactamente 
como ocurre con los vectores: elemento por elemento. De hecho, los vectores pueden con- 
siderarse como casos especiales de las matrices; son matrices con una sola columna. Así 
como con los vectores, la suma de dos matrices sólo es posible si tienen la misma forma: 


Adición A + B 2 1 1 2 3 3 DA 472 
O. 3 01+ 1-3 1] =]0 1 213 01 = ¡6 0l. 
Multiplicación 24 o 4 1.2 1.6 o 4 0 8 


Multiplicación de una matriz por un vector 


Es necesario volver a escribir las tres ecuaciones con las tres incógnitas u, v, w en la for- 
ma matricial simplificada Ax = b. Escrita completamente, la multiplicación de una matriz 
por un vector es igual al vector: 


2 y u 5 
Forma matricial Ax =b E A A Y Mo a (2) 
—2 E AS. Y 9 


El miembro derecho b es el vector columna de los “términos no homogéneos”. El miem- 
bro izquierdo es A por x. Esta multiplicación se define exactamente de modo que repro- 
duzca el sistema original. La primera componente de Ax se obtiene al “multiplicar” el pri- 
mer renglón de A en el vector columna x: 


u 
Rengión multiplicado por columna [2 1 1] vil = [2u +v +w) = 15]: (3) 
w 


La segunda componente del producto Ax es 4u — 6v + Ow, del segundo renglón de A. La 
ecuación matricial Ax = b es equivalente a las tres ecuaciones simultáneas en la ecuación (1). 

El renglón por columna es fundamental para todas las multiplicaciones de matrices. 
A partir de dos vectores produce un solo número. Este número se denomina producto in- 
terno de los dos vectores. En otras palabras, el producto de una matriz de 1 por n (un vec- 
tor renglón) y una matriz de n por 1 (un vector columna) es una matriz de 1 por 1: 


1 
Producto interno [2 1 1||1| =[2-1+1-1+1-2] =[5]. 
Pe 
Esto confirma que la solución propuesta x = (1, 1, 2) satisface la primera ecuación. 
Hay dos formas de multiplicar una matriz A y un vector x. Una forma es multiplicar 
renglón por renglón. Cada renglón de A se combina con x para obtener una componente de 
Ax. Cuando A tiene tres renglones, se tienen tres productos. 


61:12 12 EA 2050 A 


1 
Ax multiplicado por renglones |3 Q 1| |5| =|3.2+0.5+3.01|=1l61| U) 
peo lA Un a a Tí 
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Así es como suele explicarse Ax, aunque la segunda forma es igualmente importante. De 
hecho, ¡es más importante! Realiza la multiplicación de una columna a la vez. El produc- 
to Ax se encuentra de una vez, como una combinación de las tres columnas de A: 


1 1 6 q 
Ax multiplicado por columnas —2|3| +5 ]/|0| +0/3| = |6L. (5) 
dl 1 4 d 


La respuesta es dos veces la columna 1 más 5 veces la columna 2. Esto corresponde a la 
“representación por columna” de las ecuaciones lineales. Si el miembro derecho b tiene las 
componentes 7, 6, 7, entonces la solución tiene componentes 2, 5, 0. Por supuesto, la re- 
presentación por renglón coincide con aquélla (y finalmente se tienen las mismas multipli- 
caciones). 

La regla de las columnas se utilizará una y otra vez, de modo que para recalcarla se 
eS a continuación: 






CS e TIN A a Y AO VR edo 
ES PR e y eo 





coeki cientes « son las componentes pe a 


NR AN 


Para mo Á por x en n dimensiones, se requiere una notación para los elemen- 

tos individuales en A. El elemento en el renglón i y en la columna j siempre se denota por 

A. El primer subíndice proporciona el número de renglón, y el segundo subíndice indica 

la columna. (En la ecuación (4), a,, es 3 y a, es 6.) Si A es una matriz de m por n, enton- 

ces el índice i va desde 1 hasta m, ya que hay m renglones, y el índice j va desde 1 hasta n. 
En total, la matriz tiene mn elementos, y d,n, está en la esquina inferior derecha. 

Para denotar un vector basta un índice. La j-ésima componente de x se denota x,. (La 
multiplicación anterior tenía x, = 2, x2 = 5, x3 = 0.) Normalmente, x se escribe como un 
vector columna; es decir, como una matriz de n por 1. Pero algunas veces se escribe en 
una línea, como en x = (2, 5, 0). Los paréntesis y las comas recalcan que no es una ma- 
triz de 1 por 3. Se trata de un vector columna, que sólo se ha escrito temporalmente en 
forma horizontal. 

Para describir el producto Ax se utiliza el símbolo “sigma” 2, para sumatorias: 


Notación sigma 





Esta suma se lleva el ¿-ésimo renglón de A. El índice de la columna j toma cada valor des- 
de 1 hasta n y los resultados se suman: la suma €S 4,¿X; + QpX) +: + Oj Xp. 

De nuevo se observa que la longitud de los renglones (el número de columnas en A) 
debe corresponder a la longitud de x. Una matriz de »m por n multiplica un vector n-di- 
mensional (y produce un vector m-dimensional). Las sumatorias son más sencillas que es- 
cribir todo completamente, pero la notación matricial es mejor. (Einstein utilizó “notación 
tensorial”, en la que un índice repetido significa automáticamente una sumatoria. Escribió 
ax, e incluso a] x, sin el signo 2. Como no somos Einstein, mantenemos la 2.) 


Forma matricial de un paso de eliminación 

Hasta el momento, se ha utilizado una abreviatura conveniente Ax = b para denotar el sis- 
tema de ecuaciones original. Pero, ¿qué hay respecto de las operaciones que se realizan du- 
rante la eliminación? En nuestro ejemplo, en el primer paso se restó 2 veces la primera 
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ecuación de la segunda. En el miembro derecho, 2 veces la primera componente de b se 
restó de la segunda componente. Se obtiene el mismo resultado si b se multiplica por esta 
matriz elemental (o matriz de eliminación): 


1 0 0 
Matriz elemental E=|- 2 1 Ob. 
0 0 1 


Lo anterior se comprueba simplemente obedeciendo la regla para multiplicar una matriz y 
un vector: 


1 0 0 3 a 
Eb =|-2 1 0 |2| = |—124. 
0 0 1 9 9 


Las componentes 3 y 9 siguen siendo las mismas (debido a los 1, O, O y O, O, 1 en los ren- 
glones de £). La nueva segunda componente, —12, apareció después del primer paso de 
eliminación. 

Es fácil describir las matrices como E, que llevan los pasos de eliminación por sepa- 
rado. También se observa la “matriz identidad”, que no hace absolutamente nada. 





LADO 105 by 
l[=|0 1 Oj tiene lb=b Ez, = O 1 Oj tiene Ezjb = ba 
0-0 1 -£ 0 1 b3 — €by 


lb = bes la matriz análoga a multiplicar por 1. Un paso de eliminación típico multiplica 
por Ez,. La pregunta importante es: ¿Qué ocurre en el miembro izquierdo de A? 

Para preservar la igualdad, es necesario realizar las mismas operaciones en ambos 
miembros de Ax = b. En otras palabras, también el vector Ax debe multiplicarse por la 
matriz E. Nuestra matriz original E resta 2 veces la primera componente de la segunda. 
Después de este paso, el nuevo sistema más sencillo (equivalente al anterior) es justa- 
mente E(Ax) = Eb. Es más sencillo debido al cero que se creó abajo del primer pivote. 
Es equivalente porque es posible recuperar el sistema original (sumando 2 veces la pri- 
mera ecuación de regreso a la segunda). Así, ambos sistemas tienen exactamente la mis- 
ma solución x. 


Multiplicación de matrices 


Ahora hemos llegado a la pregunta más importante: ¿Cómo se multiplican las matrices? 
Hay una pista parcial de la eliminación gaussiana: Se conoce la matriz de coeficientes ori- 
ginal A, se conoce la matriz de eliminación E, y se conoce el resultado EA después del pa- 
so de eliminación. Deseamos y esperamos que 


1 0 07 multi- E EA A 
E=|-2 1 0lplicado A=| 4 -6 e EA=| O -8 -21l. 
0 0 1 por A 2 TT E 


Dos veces el primer renglón de A se ha restado del segundo renglón. La multiplicación de 
matrices es consistente con las operaciones por renglones de eliminación. El resultado pue- 


is de bp 
E IDA 


A má e el AN be 


SOPAS RONDA ENANA SUIS 








HEAD ON RARA 
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e , 
2 ¿e 


¿ur 


de escribirse como E(4x) = Eb, aplicando E a ambos miembros de la ecuación, o como 
(EA)x = Eb. La matriz EA se construye exactamente de modo que estas ecuaciones coin- 
cidan, por lo que no se requieren paréntesis: 


Multiplicación de matrices (EA multiplicada por x) es igual a (E multiplicada por Ax). 
Simplemente se escribe EAx. 


Esta es toda la cuestión de una “ley asociativa” como 2 X (3 X 4) = (2 X 3) X 4. La ley 
parece tan evidente que es difícil imaginar que podría ser falsa. Pero lo mismo puede de- 
cirse de la “ley conmutativa” 2 X 3 = 3 X 2; y para matrices, se tiene que EA no es AE. 

Para la multiplicación de matrices hay otro requerimiento. Se sabe cómo multiplicar 
Ax, una matriz y un vector. La nueva definición debe ser consistente con esta definición. 
Cuando una matriz B sólo contiene una simple columna x, el producto matriz-matriz AB 
debe ser idéntico al producto matriz-vector Ax. Más aún: Cuando B contiene varias colum- 
nas b, ba, b3, ¡las columnas de AB deben ser Ab,, Ab», Abz! 


Multiplicación por columnas  AB=AÍ[b, bz b3] =[Ab, Abz Abs). 


El primer requerimiento tenía que ver con renglones, y éste concierne a columnas. Un 
tercer método es describir cada elemento individual en AB y esperar lo mejor. De hecho, 
sólo hay una regla posible, aunque no estoy seguro de quién la descubrió. Hace funcionar 
todo. No permite la multiplicación de cualquier par de matrices. Sí son cuadradas, deben 
tener el mismo tamaño. Si son rectangulares, no deben tener la misma forma; el número 
de columnas en A debe ser igual al número de renglones en B. Así, A puede multiplicar- 
se por cada columna de B. 

Si A es m por n, y B es n por p, entonces la multiplicación es posible. El producto AB 
es una matriz de m por p. A continuación se encontrará el elemento en el renglón i y co- 
lumna ¡de AB. 





)32 = a31b12 + az2b22 + as3b32 


E AITANA rte ved, Aso A, AA] 9 87) AS 
eN 1d: NAAA PA VES DAS Aa AA ERAN 
DA 0 a AS ARE A IT AOS RE AS IO A 


Renglón 
multiplicado AB = 
por columna 





Figura 1.7 Una matriz A de 3 por 4, multiplicada por una matriz B de 4 por 2, es una ma- 
triz AB de 3 por 2. 


Nota Se escribe AB cuando las matrices no tienen nada especial que hacer con la elimi- 
nación. El primer ejemplo era EA debido a la matriz elemental E. Después se tiene PA, O 
LU, e incluso LDU. La regla para la multiplicación de matrices permanece igual, 


¡€ e A 7 EA ES, 
AS a 
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Ejemplo 1 


Ejemplo 2 


Ejemplo 3 


Aa E OE 1 0 
aB= |; E =3 dl | 


El elemento 17 es (30) + (6516), el producto interno del primer renglón de A y la pri- 
mera columna de B. El elemento 8 es (41(2) + (0(—1D), el producto interno del segundo 
renglón y la segunda columna. 

La tercera columna es cero en B, por lo que es cero en AB. B consta de tres colum- 
nas una junto a la otra, y A multiplica cada columna por separado. Cada columna de AB 
es una combinación de las columnas de A. Así como en la multiplicación matriz-vector, 
las columnas de A se multiplican por los elementos de B. 


OO 


e A E E LO E OB lo 
Matriz de intercambio de renglones | 1 +] | > 4 = pl | 


Los 1s en la matriz identidad / dejan igual a la matriz: 
Matriz identidad  JA=A y BI =B. 


Importante: La multiplicación AB también puede efectuarse renglón por renglón. En 
el ejemplo 1, el primer renglón de AB utiliza los números 2 y 3 del primer renglón de A. 
Con estos números se obtiene 2 [renglón 1] + 3 [renglón 2] = [17 1 0]. Exactamente co- 
mo en la eliminación, donde empezó todo esto, cada renglón de AB es una combinación 
de los renglones de B. 

A continuación se resumen estas tres formas de considerar la multiplicación de ma- 
trices., 





di ¿ rd renglón de A A) multiplicado por B 


Esto nos recuerda a una propiedad clave de la multiplicación de matrices. Suponga 
que las formas de tres matrices A, B, C (quizá rectangulares) permiten su multiplicación. 
Los renglones en A y B se multiplican por las columnas de B y C. Así, la propiedad clave 
es la o 





PES pa, o dE Pets 
BE A 


E: AN 
Y] Mar 
mo? 

Ó on . * 4 hs 5 $ 
e ¿A ( 
E A * 

e - y ' - > 
nos A RM PS 
AA 3) PA RAN OS 
o no. Hen E 


AB multiplicado por C es igual a A multiplicado por BC. Si ocurre que C es simplemente 
un vector (una matriz con una sola columna), este es el requerimiento (£A)x = E(Ax) ya 
mencionado. Esto constituye toda la base para las leyes de la multiplicación de matrices. 
Y sí C consta de varias columnas, basta pensar que éstas se encuentran una junto a la otra, 
y aplicar la misma regla varias veces. Cuando se multiplican varias matrices no se requie- 
ren paréntesis. 





2 
E 

E 

ES 
2 
+5 
5 
E 
Z 
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Ejemplo 4 


Ejemplo 5 
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Queda por mencionar otras dos propiedades: una que posee la multiplicación de ma- 
trices, y otra que no posee. La primera es: 





NR RS Ey 


e *os 
RS LS 












a a Ed AS A A e A » 
Por supuesto, las PS de estas matrices deben corresponder correctamente: B ye 
tienen la misma forma, de modo que es posible sumarlas, y A y D son del tamaño idóneo 
para la multiplicación por la izquierda y por la derecha. La demostración de esta ley es de- 
maslado tediosa como para escribirla. 
La propiedad que no se cumple para la multiplicación de matrices es un poco más in- 


teresante: 





Suponga que £ resta dos veces la primera ecuación de la segunda. Suponga que F es la ma- 
triz del siguiente paso, sumar el renglón 1 al renglón 3: 


0 O 10.0 
£=122 1 00 y F=|l0 1.0 
0 0 1 1.0 1 


Estas dos matrices conmutan, y el producto efectúa ambos pasos al mismo tiempo: 


E 0 0 
EF=|-2 1 0]| =PFE. 
E 05 “1 


En cualquier orden, EF o FE, así se cambian los renglones 2 y 3 usando el renglón 1. 


Suponga que E es la misma pero que G suma el renglón 2 al renglón 3. Ahora el orden es- 
tabiece una diferencia. Cuando se aplica E y luego G, el segundo renglón está modificado 
antes de afectar al tercero. Si E se aplica después de G, entonces la tercera ecuación no su- 
fre ningún efecto del primero. En el elemento (3, 1) de EG se verá un cero, mientras en GE 
hay un —2: 


E -=200 L- O 0 1.0.0 Y 000 
GE=|0 1 O =2 1 0=|-2 1 Oj pero EG=|-2 1 0 
Oui O 0 1 2 1 1 0 1 1 


Así, EG 4% GE. Un ejemplo aleatorio mostraría el mismo hecho: la mayor parte de las ma- 
trices no conmutan. Aquí las matrices tienen sentido. Hay una razón por la cual EF = FE, 
y otra por la cual EG 4 GE. Merece la pena realizar otro paso, para ver lo que ocurre con 
las tres matrices de eliminación a la vez: 


100 DQO 
GFE=|-2 1 0 y EFG=|-2 1 0 
1 | : O 


El producto GFE es el verdadero orden de eliminación. Es la matriz que lleva la matriz ori- 

ginal A a la triangular superior U. Este hecho se verá de nuevo en la siguiente sección. 
La otra matriz, EFG, es más agradable. En ese orden, los números —2 de E y 1 de F y 

G no fueron alterados. Se escribieron igual en el producto. Es el orden incorrecto para la 
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eliminación. Pero por fortuna, se trata del orden correcto para invertir los pasos de elimi- 
nación, lo cual también se verá en la siguiente sección. 

Observe que el producto de matrices triangulares inferiores también es triangular in- 
ferior. 


Conjunto de problemas 1.4 
1. Calcule los productos 
4 0 1 3 LSO 5 
O.) E O dy 00d 0 21 y b A A 
4 O 1 y 0 0 1 3 


Para el tercero, trace los vectores columna (2, 1) y (0, 3). La multiplicación por (1, 1) 
simplemente suma los vectores (hágalo gráficamente). 


2. Trabaje con una columna a la vez para calcular los productos 


o E O A, 4 3 
sap B]o [956 [1] y [os 


o 
E 


61 de Ss AO 8 9 
3. Encuentre dos productos internos y un producto de matrices: 
1 3 1 
[1 =2 7]]-2| y [1 -2 7] [5] y |-2[|[3 s 1] 
7 1 7 


Con el primero se obtiene la longitud del vector (al cuadrado). 


4. Si una matriz A de m por n multiplica a un vector n dimensional x, ¿cuántas multipli- 
caciones por separado están implicadas? ¿Qué ocurre si A multiplica a una matriz B de 
n por p? 


5. Multiplique Ax para encontrar un vector solución x del sistema Ax = vector cero. ¿Pue- 
de encontrar más soluciones para Ax = 0? 


3-6 0]|]|2 
Ax = 0 2 -—2| |1]. 
1 -1 -—1 1 
6. Escriba las matrices A y B de 2 por 2 cuyos elementos son ay = ¿+ y by =(=1)**., 
Maultiplíquelas para encontrar AB y BA. 
7. Proporcione ejemplos de 3 por 3 (no sólo la matriz cero) de 
a) una matriz diagonal: a, =0s1i%j. 
b) una matriz simétrica: ay; = a, para toda i y j. 
c) una matriz triangular superior: a = Osii>|j. 
d) una matriz simétrica sesgada: a; = —aj para toda i y j. 
8. Las siguientes subrutinas, ¿multiplican Ax por renglones o por columnas? Empiece 
con BY) = 0: 
DO 101 = 1,N DO 10J = 1N 
DO 10J = 1,N DO 101 =1,N 
10 BD =B(0 + AMD *X() 10 BO =BOD +A(J * X() 





9. Si los elementos de A son a 


10. 


11. 


12 


s 


13. 


14. 


15. 


16. 


ye 
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Las salidas Bx = Ax son las mismas. El segundo código es ligeramente más eficaz en 
FORTRAN, y mucho más eficaz en una máquina vectorial (el primero cambia los ele- 
mentos simples B (1), mientras el segundo es capaz de actualizar vectores completos). 


¡y USe notación de subíndices para escribir 
a) El primer pivote. 

b) El multiplicador £;; del renglón 1 que debe restarse del renglón :. 
c) El nuevo elemento que sustituye a a; después de la sustracción. 


d) El segundo pivote. 


¿Falso o verdadero? Cuando sea falso, proporcione un contraejemplo. 

a) Si las columnas 1 y 3 de B son las mismas, también las columnas 1 y 3 de AB son 
las mismas. 

b) Si los renglones 1 y 3 de B son los mismos, también los renglones 1 y 3 de AB son 
los mismos. 

c) Si los renglones 1 y 3 de A son los mismos, también los renglones 1 y 3 de AB son 
los mismos. 

d) (ABY = A? B?. 

El primer renglón de AB es una combinación lineal de todos los renglones de B. ¿Cuá- 

les son los coeficientes en esta combinación? y ¿cuál es el primer renglón de AB, si 


1 
a= |; Ne 4 y B=|0 1|? 
10 


El producto de dos matrices triangulares inferiores es nuevamente triangular inferior 
(todos sus elementos arriba de la diagonal principal son cero). Confirme esto con un 
ejemplo de 3 por 3, y luego explique por qué este hecho se deduce a partir de las le- 
yes de la multiplicación de matrices. 


Por ensayo y error, encuentre ejemplos de matrices de 2 por 2 tales que 
a) A? = —I, donde A sólo tiene elementos reales. 

b) B? = 0, aunque B % O. 

c) CD = —DC, no permitiendo el caso CD = 0. 

d) EF = 0, aunque ningún elemento de E o F es cero. 


Describa los renglones de EA y las columnas de AE si 


Elo 
04m 


Suponga que A conmuta con toda matriz de 2 por 2 (AB = BA), y en particular 


E E 0 eS e AS, E o 
a=|: Al conmuta con Br =|, o! y B.=|0 o 


Demuestre que a = dyb=c=0.Si AB = BA para todas las matrices B, entonces Á 
es un múltiplo de la identidad. 


Sea x el vector columna (1, 0,..., 0). Demuestre que la regla (4B)x = A(Bx) obliga a 
que la primera columna de AB sea igual a A multiplicada por la primera columna de B. 


¿Cuál(es) de la(s) siguiente(s) matrices garantizan ser iguales a (4 + B)*? 
AL+2AB+B? AA+B)+B(A+B) (A+ BXB+A), 4? +AB+BA + B”. 
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18. SiA y B son matrices de n por n con todos los elementos iguales a 1, encuentre (AB),. 
La notación de la sumatoria transforma el producto AB, y la ley (AB)C = A(BC), en 


(AB), =D _Girbr; de (Lau) E S as (E buen) 
, AS k j 


Calcule ambos miembros de C si también es de a por n, con todo cy = 2. 





19. Una cuarta forma de multiplicar matrices es multiplicando las columnas de A por los 





renglones de B: 

AB = (columna renglón 1) + : : - + (columna nr) Mrenglón n) = suma de matrices 
simples. 

Proporcione un ejemplo de 2 por 2 de esta importante regla para la multiplicación de 
matrices. 





20. La matriz que rota el plano x-y en un ángulo 9 es 


cos0 —senó 
senó  cosg|' 


ac) = | 


Compruebe que A(9/)4(02) = A(9, + 02) a partir de las identidades para cos(0, + 02) 
y sen(9, + 0). ¿A qué es igual 4(9) multiplicada por A(—0)? 


21. Encuentre las potencias A?, A” (4? multiplicada por A), y B?, B?, C?, C?. ¿Qué son A*, 


B* y C*7 
dl 
il y B=|) Br y c=ab= | | 


1 iS | 
NE > 
22. Escriba las matrices de 3 por 3 que producen los siguientes pasos de eliminación: 


Ni Ni 
Ni Nin 
Di ni 


Los problemas 22 a 31 son sobre matrices de eliminación. 


a) E, resta 5 veces el renglón 1 del renglón 2. 
b) Ex, resta —7 veces el renglón 2 del renglón 3. 
c) P intercambia los renglones 1 y 2, y luego los renglones 2 y 3. 





23, En el problema 22, al aplicar E», y luego £32 a la columna b = (1, O, 0) se obtiene 
Ez2E310 => . Al aplicar Ez» antes que Ez; se obtiene E>¡Ez2b as . Cuando 


se aplica primero Ez», el renglón no se ve afectado por el renglón 


a 














24. ¿Cuáles son las tres matrices E,;, E31, Ez, que hacen de A una forma triangular U? 


LES. 


Multiplique estas matrices E para obtener una matriz M que haga la eliminación: 
MA = U. 


25. Suponga que az3 = 7 y que el tercer pivote es 5. Si a33 se cambia a 11, el tercer pivo- 
te es . Si 433 cambia a , en la posición pivote hay un cero. 


E IS. 
A = 4 6 1 Y EnEs ¡En A = U. 











26. Si cada columna de A es un múltiplo de (1, 1, 1), entonces Ax siempre es un múltiplo de 
(1, 1, 1). Escriba un ejemplo de 3 por 3. ¿Cuántos pivotes se producen por eliminación? 


27. ¿Qué matriz Ex, resta 7 veces el renglón 1 del renglón 3? Para invertir este paso, Ry31 
debe 7 veces el renglón al renglón . Multiplique Ez, por R3,. 








ANI A A A A A e NO O 
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28. a) E,, resta el renglón 1 del renglón 2 y luego P,3 intercambia los renglones 2 y 3. 
¿Qué matriz M = PE, realiza ambos pasos a la vez? 


b) P,3 intercambia los renglones 2 y 3 y luego Ez, resta el renglón 1 del renglón 3. 
¿Qué matriz M = Ez,P,3 realiza ambos pasos a la vez? Explique por qué las ma- 
trices M son las mismas pero las matrices E son distintas. 

29. a) ¿Qué matriz £,3 de 3 por 3 suma el renglón 3 al renglón 1? 


b) ¿Qué matriz suma el renglón 1 al renglón 3 y al mismo tiempo suma el renglón 3 al 
renglón 1? 


C) ¿Qué matriz suma el renglón 1 al renglón 3 y luego suma el renglón 3 al renglón 10 


30. Multiplique las siguientes matrices: 


0,1071 1 DnOaral E 070 iS 
O: L-:0 4 5 6 Do 15 ED y =1 1 0 ¡UA E: E 
1100 139 12000 -1 0 1 140 
31, ¿Cuáles matrices de eliminación £»,, E32 y £43 requieren la siguiente matriz de 4 por 4? 
2-1. 0 0 
 -1 2-1 0 
ii O > 
0 0-1 2 


Los problemas 32 a 44 son sobre la obtención y multiplicación de matrices. 


32. Escriba estos problemas clásicos en forma matricial de 2 por 2 para Ax = b y resuél- 
valos: 

a) X es dos veces más viejo que Y y la suma de la edad de ambos es igual a 39. 

b) (x, y) = Q,5) y O, 7) está en la recta y = mx + c. Encuentre m y c. 


33. La parábola y = a + bx + cx? pasa por los puntos (x, y) = (1, 4) y (2, 8) y (3, 14). 
Encuentre y resuelva una ecuación matricial para las incógnitas (a, b, c). 


34. Multiplique las siguientes matrices en los órdenes EF, FE y E? 


E 3 E 6 FOO 
Ex=la 1 0 F=|0 1 0 
b 0 1 0 | 


35. a) Suponga que todas las columnas de B son las mismas. Entonces todas las colum- 
nas de EB son las mismas, ya que cada una es E multiplicada por 


b) Suponga que todos los renglones de B son [1 2 4]. Demuestre con un ejemplo que 
todos los renglones de EB no son [1 2 4]. Es cierto que todos estos renglones son 








36. Si E suma el renglón 1 al renglón 2, y F suma el renglón 2 al renglón 1, ¿es cierto que 
EF es igual a FE? 


37. La primera componente de Ax €s 2, 4;; Xx; = 011%, +:** + 017 X,. Escriba fórmulas 
para la tercera componente de Ax y el elemento (1, 1) de A?. 


38. SiAB = ly EC = 1, aplique la ley asociativa para demostrar que 4 = C. 


39. A es 3 por 5, Bes 5 por 3, Ces 5 por 1, y Des 3 por 1. Todos los elementos son 1. 
¿Cuáles de las siguientes operaciones matriciales son permitidas, y cuáles son los re- 
sultados? 

BA AB ABD DBA A(B +0). 


a PP Y PP — 
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40. ¿Qué renglones, columnas o matrices es necesario multiplicar para encontrar, 
ay la tercera columna de AB? 
b) el primer renglón de AB? 
c) el elemento en el renglón 3, columna 4 de AB? 
d) el elemento en el renglón 1, columna 1 de CDE? 


41. (Matrices de 3 por 3) Escoja la única B de modo que para toda matriz A, 
a) BA = 44. 
b) BA = 4B. 
c) BA tiene invertidos los renglones 1 y 3 de A y el renglón 2 sin cambio. 
d) Todos los renglones de BA son los mismos que el renglón 1 de A. 


42. ¿Falso o verdadero? 
a) Si A” está definida, entonces A es necesariamente cuadrada. 
b) SI AB y BA están definidas, entonces Á y B son cuadradas. 
c) Si AB y BA están definidas, entonces AB y BA son cuadradas. 
d) Si AB = B, entonces A = Í, 
43. Si A es de m por n, ¿cuántas multiplicaciones por separado están implicadas si 
a) A multiplica un vector x con n componentes? 
b) A multiplica una matriz B de n por p? Entonces AB es m por p. 
c) A se multiplica a sí misma para producir 42? Aquí m = n. 


44, Para demostrar que (AB)C = A(BC), use los vectores columna b,, : * - , b, de B. Pri- 
mero suponga que C tiene una sola columna e con elementos C,,***, Cp! 
AB tiene columnas Ab,, : : * , Ab, y Bc tienen una columna cb, + ::* + cb. 


Entonces (AB)c = c¡Ab, +: ++ + c,Ab, es igual a Alcib;, + :** + c,rb,) = A(Bo). 
La linealidad proporciona la igualdad de estas dos sumas, y (4AB)c = A(Bc). Lo mis- 
mo es cierto para todos (todas) los (las) de C. En consecuencia, (ABJC = A(BC). 





En los problemas 45 a 49 se utiliza multiplicación columna-renglón, y multiplicación 
en bloque. 





45. Multiplique AB usando multiplicación de columnas por renglones: 


[68 1 
AB=|2 4 a =(21630]+ = 
2d za 


46. La multiplicación en bloque separa las matrices en bloques (submatrices). Si sus for- 
mas hacen posible la multiplicación en bloque, entonces es permitida. Sustituya las si- 
guientes x por números, y confirme que la multiplicación en bloque es exitosa. 


C E: 6 de TS y 
[A B] BH = |AC+BD) y >: > NN o e 
e O Xx 


47. "Trace los cortes en A y B y AB para mostrar cómo cada una de las cuatro reglas de la 
multiplicación es en realidad una multiplicación en bloque para encontrar AB: 
a) La matriz A multiplicada por las columnas de B. 
b) Los renglones de A multiplicados por la matriz B. 





48. 


49. 


50. 


51 


+ 


52. 


53 


> 


54. 


20. 


56. 
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58. 


A E ES EA A EAT RENT 
UE a e do CON AE 

E y 1,4 > Notación matricial y multiplicación de matrices 31 
ing. PERZ ay LTL CAJGUAY 


c) Los Dl EN o deb: 
d) Las columnas de A multiplicadas por los renglones de B. 


La multiplicación en bloque indica que la eliminación en la columna 1 produce 


ne lt Olla bi. la .b 
iia a 4 h a o F 
Eliminación para una matriz en bloque de 2 por 2: Cuando A7!A = 1, el primer ren- 


glón en bloque se multiplica por CA”! y se resta del segundo renglón, para encontrar 
el “complemento de Schur” $: 


E OTTA Bl IAB 
=CA?* I E DA > 0 E 
Con É* = —1, el producto (4 + ¡BXx + iy) es Ax + ¡Bx + ¡Ay — By. Use bloques pa- 
ra separar la parte real de la parte imaginaria que multiplica ¿: 


A —Blix| _ |Ax— By| parte real 
e Es ? parte imaginaria 


Suponga que resuelve Ax = b para tres miembros derechos especiales de b: 
1 0 0 
Ax; = ¡0 y Ax = 1 y Ax3 = jOl. 
0 0 1 


Si las soluciones x,, X2, Xx son las columnas de una matriz X, ¿qué es AX? 


Si las tres soluciones en el problema 31 son x, = (1,1, D) y x2 = (0, 1, 1) y x3 = 
(0, O, 1), resuelva Ax = hb cuando b = (3, 5, 8). Pregunta de desafío: ¿Qué es A? 


Encuentre todas las matrices 


E e, 1 0 IS E E! 
A= |: el que satisfacen 3h Dl E A. 


Si una matriz noroeste A se multiplica por una matriz sureste B, ¿qué tipo de matrices 
son AB y BA? “Noroeste” y “sureste” significa ceros abajo y arriba de la antidiagonal 
que va de (1, n) a (n, 1). 


Escriba 2x + 3y + z + 5t = 8 como una matriz A (¿cuántos renglones tiene?) multi- 
plicando el vector columna (x, y, z, t) para Obtener b. Las soluciones llenan un plano 
en el espacio tetradimensional. El plano es tridimensional sin volumen de 4-dimensio- 
nes. 


¿Cuál es la matriz P, de 2 por 2 que proyecta el vector (x, y) sobre el eje x para produ- 
cir (x, 0)? ¿Cuál es la matriz P, que proyecta el vector (x, y) sobre el eje y para producir 
(0, y)? Si se multiplica (5, 7) por P, y luego se multiplica por P,, se obtienen ( ) y 
( hi 

Escriba el producto interno de (1, 4, 5) y (x, y, z) como una multiplicación de matrices 


Ax. A tiene un renglón. Las soluciones de Ax = O están en un perpendicular al 
vector . Las columnas de A sólo están en el espacio dimensional. 





En notación de MATLAB, escriba los comandos que definen la matriz A y los vecto- 
res columna x y b. ¿Cuál es el comando que prueba si Ax = bo no? 


cd E ml 


32 
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59. Los comandos MATLAB A = eye(3) y v = [3:5]' producen la matriz identidad de 3 
por 3 y el vector columna (3, 4, 5). ¿Cuáles son las salidas de A * v y v” * v? (¡No se 
requiere computadora!) Si pregunta por v * A, ¿qué ocurre? 


60. Si la matriz de 4 por 4 integrada sólo por unos Á = ones(4, 4) se multiplica por la co- 
lumna v = ones(4, 1), ¿qué es A * v? (No se requiere computadora) Si B = eye(4) 
+ ones(4, 4) se multiplica por w = zeros(4, 1) + 2* ones(4, 1), ¿qué es B * w? 


61. Escriba una matriz mágica M de 3 por 3 con elementos 1, 2,..., 9. La suma de to- 
dos los elementos de los renglones, de las columnas y de la diagonal debe ser igual a 
15. El primer renglón podría ser 8, 3, 4. ¿Cuánto es M por (1, 1, 1)? ¿A qué es igual el 
vector renglón [1, 1, 1] multiplicado por M? 


1.5 FACTORES TRIANGULARES E INTERCAMBIOS DE RENGLONES 


Se desea considerar nuevamente la eliminación para ver lo que significa en términos de 
matrices. El punto de partida fue el sistema modelo Ax = b: 


2 ¡E | u 5 
Ax=| 4 -6 0O| [vi =|-2| =b. (1) 
—2 SE 1 9 


Luego había tres pasos de eliminación, con multiplicadores 2, —1, —1: 


Paso 1. Restar 2 veces la primera ecuación de la segunda. 
Paso 2. Restar —-1 vez la primera ecuación de la tercera. 
Paso 3. Restar —1 vez la segunda ecuación de la tercera. 


El resultado era un sistema equivalente Ux = c, con una nueva matriz de coeficientes U: 


Es l 0 A 3 
Triangular superior Ux=|0 -8 -—2| [vi = |-12| =c. (2) 
0 0 1 w 2 


Esta matriz U es triangular superior. todos los elementos debajo de la diagonal son cero. 

El nuevo miembro derecho c se obtuvo a partir del vector original b siguiendo los mis- 
mos pasos que llevan de A a U, La eliminación hacia adelante equivale a tres operaciones 
en renglones: 


Empezar con A y b; 
Aplicar los pasos 1, 2, 3 en ese orden; 
Terminar con U y c. 


Ux = c se resuelve por sustitución hacia atrás. Aquí nos centramos en relacionar A con U. 
Las matrices E para el paso 1, F para el paso 2, y G para el paso 3 se presentaron en 
la sección precedente. Se denominan matrices elementales, y es fácil ver cómo trabajan. 
Para restar un múltiplo £ de la ecuación j de la ecuación i, el número —£ se escribe en la 
posición (1, j). En caso contrario, se preserva la matriz identidad, con 1s en la diagonal y Os 
fuera de ésta. Luego, la multiplicación de matrices realiza la operación en los renglones. 
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El resultado de todos los tres pasos es GFEA = U. Observe que E es la primera en 
multiplicar a A, luego es f; y por último G. Puede multiplicarse GFE entre sí para encon- 
trar una simple matriz que lleve A a U (y también b a c). Es una matriz triangular inferior 
(se omiten los ceros): 


1 1 1 1 
DeAaU GFE= 1 1 =2 1 =|-2 1 pd) 
Ls dl 1 1 1 1 1 


Esto es bueno, pero la pregunta más importante es exactamente lo opuesto: ¿Cómo puede 
regresarse de U a A? ¿Cómo pueden deshacerse los pasos de la eliminación gaussiana? 

Deshacer el paso 1 no es difícil. En lugar de restar, se suma dos veces el primer ren- 
glón al segundo. (¡No dos veces el segundo renglón al primero!) El resultado de realizar 
tanto la sustracción como la adición es recuperar la matriz identidad: 


La inversa de 100 LSENDAD 150 +0 
la sustracción dl Dam =2 LL 01 = 0: 1 0. (4) 
es la adición 0.0 1 O y US | 010.1 


Una operación cancela la otra. En términos matriciales, una matriz es la inversa de la otra. 
Si la matriz elemental E contiene al número —£ en la posición (i, /), entonces la inversa 
ET? contiene a +4 en esa posición. Por tanto, E El que es la ecuación (4). 

Cada paso de la eliminación puede invertirse, usando E”! y F7! y G7?. Considero que 
no es malo abordar las inversas ahora, antes de la siguiente sección. El problema final es 
deshacer todo el proceso de una vez, y ver qué matriz regresa U a A. 

Debido a que el paso 3 fue el último yendo de A a U, su matriz G debe ser la prime- 
ra en ser invertida en la dirección opuesta. ¡Las inversas se presentan en orden opuesto! 
El segundo paso en reversa es F”? y el último es E”!: 


Regreso aA desde U — — ETlETIGIU=A es LU=A. (5) 


Es posible sustituir GFEA por U con la finalidad de ver, cómo las inversas eliminan los pa- 
sos originales. 

Luego se reconoce la matriz L que regresa U a A. Se denomina L porque es triangu- 
lar inferior. Y posee la propiedad especial de que sólo puede verse, multiplicando las tres 
matrices inversas en el orden correcto: 


1 1 1 ] 
E“JLFiG<12 1 1 1 =1.02 1 =L. (6) 
il 1 cae | Y. =1 01 


La cuestión especial es que los elementos abajo de la diagonal son los multiplicadores 
£ =2,-—1, y —1. Cuando se multiplican matrices, suele no haber una forma directa de leer 
la respuesta. Aquí las matrices se presentan justo en el orden correcto, de modo que su pro- 
ducto puede escribirse de inmediato. Si la computadora almacena cada multiplicador £ ,, el 
número que multiplica el renglón pivote ¡ cuando se resta del renglón í y produce un cero 
en la posición ¿, j, entonces estos multiplicadores proporcionan un registro completo de la 
eliminación. 
Los números ¿el tienen cabida perfecta en la matriz L que lleva U de nuevo a A. 


et yenes pto, PRA A e 
io CES RO 
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Ejemplo 3 
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E EA 0 E >> 7 es 
Á = p 4 a U = a 4 con £ = E E Luego, LU = A. 


Lo cual necesita un intercambio de renglones 


A = E *] no puede factorizarse en A = LU. 


(con todos los pivotes y multiplicadores iguales a 1) 


ys Ll 00 ¡O O: 
A="1 2 2+= PL 10 O. LL 14 UL 
MS ¡US O: e US: 


De A a U hay restas de renglones. De U a A hay sumas de renglones. 


(cuando U es la identidad y L es la misma que A) 


LOS O 
Caso triangular inferior .A=|£f, 1 0l. 
Ea bazo dl 


Los pasos de eliminación en esta A son fáciles: 1) E resta £,, veces el renglón 1 del renglón 
2,11) F resta £,, veces el renglón 1 del renglón 3, y 111) G resta £3, veces el renglón 2 del 
renglón 3. El resultado es la matriz identidad U = /. Las inversas de E, E y G producen de 
regreso A: 


E”! aplicada a F”? aplicada a G”* aplicada a / produce A. 


1 Mult1- 1 Multi- | 1 es 1 0 0 
Lay 1 plicada l plicada l igual La1 1 O |. 
1 por L31 1 por lr 1 a la to 1 


El orden es correcto para que los £s estén en su posición. ¡Esto ocurre siempre! Observe 
que los paréntesis en E”*F71G”? no fueron necesarios debido a la ley asociativa. 


A = LU: El caso n por n 


La factorización A = LU es tan importante que es necesario comentar más acerca de ella. 
Normalmente se la ignoraba en cursos de álgebra lineal cuando la orientación de éstos era 
la parte abstracta. O quizá se pensaba que era demasiado difícil, pero es necesario abordarla. 
Si el último ejemplo 4 permite cualquier U en vez de la U particular U = [, es posible perca- 
tarse de cómo trabaja la regla en general. La matriz L, aplicada a U, regresa A: 


1 0-0 renglón 1 de U 
A = LU fa 1 0 renglón 2 de U | = A original. (D 
L31 lo 1 renglón 3 de U 


















































Ejemplo 5 
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La demostración es aplicar los pasos de eliminación. En el miembro derecho, éstos llevan 
A a U. En el miembro izquierdo reducen £ a [, como en el ejemplo 4. (El primer paso res- 
ta £,, veces (1, O, 0) del segundo renglón, con lo cual se elimina £,,.) Ambos miembros 
de (7) terminan iguales a la misma matriz U, y todos los pasos para llegar ahí son reversi- 
bles. En consecuencia (7) es correcta y A = LU. 

A = LU es tan crucial, y tan bella, que el problema 8 al final de esta sección sugiere 
un segundo método. Aquí se están escribiendo matrices de 3 por 3, aunque el lector puede 
darse cuenta de la forma en que los razonamientos se aplican a matrices más grandes. 
A continuación se proporciona otro ejemplo, y luego se empieza a utilizar A = LU. 


(A = LU, con ceros en los espacios vacíos) 


Ta 1 1 
E! Ae A e 
á Ad ES 2 RE 
E E 1 


Esto demuestra cómo una matriz Á con tres diagonales tiene factores L y U con dos diago- 
nales. Este ejemplo proviene de un problema importante en ecuaciones diferenciales (véa- 
se la sección 1.7). La segunda diferencia en A es la diferencia hacia atrás L multiplicada 
por una diferencia hacia adelante U. 


A A A A 


Un sistema lineal = Dos sistemas triangulares 


Hay un punto práctico importante que mencionar sobre A = LU. Es más que un simple re- 
gistro de pasos de eliminación; £ y U son las matrices derechas para resolver Ax = b. De 
hecho, ¡es posible descartar a A! De b a c se va por eliminación directa (que utiliza L), y 
de c ax se va por sustitución hacia atrás (que usa U). Esto puede y debe hacerse sin A: 


Separación de Ax =b Primero Lc=b  yluego Ux=c. (8) 


La segunda ecuación se multiplica por L para obtener LUx = Lc, que es Ax = b. Cada sis- 
tema triangular se resuelve rápidamente. Esto es exactamente lo que un buen código de elt- 
minación hace: 






E E PAR pra pa 





RAS de e 


L. Factoriza ka parte “de. encuentran: sus factores LyU 


PSA SEA RA 


Resuelve (á parir de de L EN Y q Ena la solución Do 


es dE 
9 epa dt AR 
; Eo a A SAC 


La separación entre Factoriza y Resuelve significa que es posible procesar una serie de bs. 
La subrutina Resuelve obedece la ecuación (8): dos sistemas triangulares en n?/2 pasos ca- 
da uno. La solución para cualquier miembro derecho nuevo b puede encontrarse en 
sólo n? operaciones. Esto es mucho menos que los n*/3 pasos necesarios para factorizar A 
en el miembro izquierdo. 


Capítulo 1 Matrices y eliminación gaussiana 


Ejemplo 6 Esta es la matriz previa A con miembro derecho b = (1, 1, 1, 1). 


SS e] = 1 
KA —Xx1 + 2X— X3 = 1 E 
Ax =b AE se separaen Lc =b y Ux=c. 
—x3 + 2x4 = 1 
C1 =1 1 
Lc=b a ps id E : proporciona c = z : 
—C(3 +04 =1 4 
2 Us 17 =] 10 
7 A AA = 2 . eN 9 
Ux =c a proporciona x 7 | 
AI 4 4 


Para estas “matrices tridiagonales” especiales, la operación cae desde n? hasta 2n. Usted 
verá cómo Lc = b se resuelve hacia adelante (c; viene antes de c,). Esto es precisamente 
lo que ocurre durante la eliminación hacia adelante. Luego, Ux = c se resuelve hacia atrás 
(x4 antes de x3). 


Observación 1 La forma LU es “no simétrica” en la diagonal: L tiene 1s donde U tiene los 
pivotes. Esto es fácil de corregir: U se divide entre una matriz pivote diagonal D: 


d; 1 Urol d; ul d; 


da J U>z3/ d) 


FactorizarD  U= (9) 


da, 1 
En el último ejemplo, todos los pivotes eran d, = 1. En ese caso D = 1. Pero esto fue muy 


excepcional, y normalmente LU es diferente de LDU (lo cual también se escribe como 
LDV). 


La factorización triangular puede escribirse como A = LDU, donde L y U tienen 


1s. en la diagonal, y D es la matriz diagonal de pivotes. 





Siempre que se observa LDU o LDV, se entiende que U o V tiene 1s en la diagonal: cada 
renglón se dividió entre el pivote en D. Luego, L y U se tratan de la misma forma. Á con- 
tinuación se muestra un ejemplo de separación de LU en LDU. 


E, E E E: 1 Pe TS | 1 A 
A 

Lo anterior tiene los 1s en las diagonales de £ y U, y los pivotes 1 y 2 en D. 
Observación 2 Al describir cada paso de eliminación, quizá dimos la impresión de que los 


cálculos deben realizarse en ese orden. Esto es erróneo. Hay algo de libertad, y hay un “al- 
goritmo Crout” que arregla los cálculos de una manera ligeramente distinta. 
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En las L, D, y U finales no hay libertad. Esta es la cuestión más importante: 


ETA 4 E AN: Sos 
> don a a o 
HUT YE bién A : 
sb, X A eS ERA E o AE SS E ió ETS Se 
uni E son tri eS S O : 
ag e E 
4h. ud 


AS ASE NR E 


anales ; la nal, entonces 
SS diagona! ala Laa | entonces L Ls 


| 2 La factorizaci o ¡DU y! la fact eS LU están determinadas de 
E Ea ¿% ' ea o 3 


RSLERA ZAS 
PO 





La demostración constituye un buen ejercicio en la siguiente sección. 


Intercambios de renglones, y matrices de permutación 


Ahora es necesario enfrentar un problema que se ha evitado hasta el momento: el número 
que se espera utilizar como pivote puede ser cero. Esto puede ocurrir en medio de un cálcu- 
lo. Ocurrirá casi al principio si 4,1, = O. Un simple ejemplo es 


.... s 0 2 ul bi 
Cero en la posición piyote | 3 A B = e 


La dificultad es evidente; ningún múltiplo de la primera ecuación elimina al coeficiente 3. 
El remedio es igualmente claro. Intercambiar las dos ecuaciones, moviendo el 
elemento 3 hacia el pivote. En este ejemplo, la matriz pudo transformarse en triangu- 
lar superior: 
3u +4v = ba 
2v =b; 


Para expresar esto en términos matriciales, se requiere la matriz de permutación P que 
produce el intercambio de renglones. Se obtiene al intercambiar los renglones de /. 


MEE E O E OS LO e 1 0 O O E 
Permutación p=' o| y pa= | o! E 2 =l: a 


P tiene el mismo efecto sobre b, intercambiando b, y b,. El nuevo sistema es P Ax = Pb. 
Las incógnitas u y v no se invierten en un intercambio de renglones. 

Una matriz de permutación P tiene los mismos renglones que la identidad (en algún 
orden). En cada renglón y columna hay un simple “1”. La matriz de permutación más co- 
mún es P = [ (no intercambia nada). El producto de dos matrices de permutación es otra 
permutación: los renglones de / se reordenan dos veces. 

Después de P = /, las permutaciones más sencillas intercambian dos renglones. Otras 
permutaciones intercambian más renglones. Hay n! = (mín — 1) - - - (1) permutaciones 
de tamaño ». El renglón 1 tiene n opciones; luego, el renglón 2 tiene n — 1 opciones, y fi- 
nalmente el último renglón sólo tiene una opción. Es posible mostrar todas las permutacio- 
nes de 3 por 3 (hay 3! = (120) = 6 matrices): 


1 1 1 
IT = 1 Pa = 1 PraP2 = 1 


Intercambio de renglones 


Ra 1 Py = 1 Pax = 1 


 _ A —_— e A A A A A A A A rre mermamarars 


vilo 
q! 
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Hay 24 matrices de permutación de orden n = 4. Sólo hay dos matrices de permutación de 


orden n = 2; a saber, 
L 50 do 4 
(5 al da uE" 


Una vez que se conoce sobre inversas y traspuestas (en la siguiente sección se definen 
AT! y AP), se descubre un hecho importante: P 7? siempre es igual a P*. 

Un cero en la ubicación del pivote origina dos posibilidades: El problema puede ser 
fácil de arreglar, o puede ser grave. Esto se decide al observar abajo del cero. Si más aba- 
jo en la misma columna hay un elemento distinto de cero, entonces se realiza un intercam- 
bio de renglones. El elemento distinto de cero se convierte en el pivote necesario, y la eli- 
minación puede continuar de nuevo: 


04 7D d =0 => ningún primer pivote 
A=|0 0 c a =0 ==> ningún segundo pivote 
ae eb c=0 => ningún tercer pivote 


Si d = O, entonces el problema es incurable y esta matriz es singular. No hay esperanza de 
una solución única de Ax = b, Si d no es cero, un intercambio P,3 de los renglones 1 y 3 
mueve d al pivote. No obstante, la siguiente posición pivote también contiene un cero. El 
número a está ahora abajo del cero (el e arriba del cero es inútil). Si a no es cero, entonces 
se requiere otro intercambio de renglones Pz: 


0 0 1 OS 0 de f 
Pi = 0 E 3 y Paz = 07031 y Pra PjA = 0 a b 
1 DS, Or tl: 90 DO -0 € 


Una cuestión más: La permutación P,3 P ¡3 realiza los dos intercambios de renglones 
a la vez: 


IERO0 ONO 0>:0-=1 
P,, actúa primero — P3Pj3=|0 0 1 0 4-01 += TEL 01 =P. 
CO E E JS + O, O 150 


De haberlo sabido, hubiera sido posible multiplicar A por P en primer lugar. Con los ren- 
glones en el orden correcto PA, cualquier matriz no singular está lista para el proceso de 
eliminación. 


Eliminación en pocas palabras: PA = LU 


La cuestión más importante es la siguiente: Si la eliminación puede completarse con ayu- 
da de intercambios de renglones, entonces es posible suponer que estos intercambios se 
realizan primero (por P). La matriz PA no requiere intercambios de renglones. En otras pa- 
labras, PA permite la factorización normal en L£ multiplicada por U. La teoría de la elimi- 
nación ESuSBiaDa pis resumirse en unas cuantas líneas: 


Ma 
y BS 5 
pa MIER z SN a E, 





A 


En el caso. "singular, ninguna 13 puede producir u nc conjur y 
eliminación fracasa. ] S 





y 
y 





Ejemplo 7 
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En la práctica, también es posible considerar un intercambio de renglones cuando el 
pivote original está próximo a cero: aun cuando no sea exactamente igual a cero. Cuando 
se elige un pivote más grande se reduce el error por redondeo. 

Debe tenerse cuidado con £. Suponga que la eliminación resta el renglón 1 del ren- 
glón 2, creando £,; = 1. Luego suponga que intercambia los renglones 2 y 3. Si este inter- 
cambio se realiza de antemano, el multiplicador cambia a £3, = len PA = LU, 


O, AS 1 A A 
A=|1 1 3|>]/0 0 2| +0 3 6| =0L,. (10) 
LOS 0 3 6 A 0 BE 
Ese intercambio de renglones recupera LU, pero no €3; = 1 y £,, = 2: 
E 00 1.0.0 
P=|0 0 1 Y bel 10 y  PA=LU. (a) 
0 10 Ol 


En MATLAB, A([r k],:) intercambia el renglón k con el renglón r abajo del renglón 
k (donde se ha encontrado el k-ésimo pivote). Las matrices L y P se actualizan de la mis- 
ma manera. Al principio, P = Í y signo = +1: 


At[rk].:)=A([kr], 2): 

L([r k],1:k-1) = L([k r],1:k-1); 
PERL) = Pl.) 

sign = —sign 


El “signo” de P indica si el número de intercambios de renglones es par (signo = +1) o 
impar (signo = —1). Un intercambio de renglones invierte el signo. El valor final del sig- 
no es el determinante de P y no depende del orden de los intercambios de renglones. 

En resumen: Un buen código de eliminación ahorra L y U y P. Estas matrices contie- 
nen la información que originalmente estaba en A, y la contienen en una forma más utiliza- 
ble. Ax = b se reduce a dos sistemas triangulares. Este es el equivalente práctico del cálculo 
que se presenta a continuación: encontrar la matriz inversa A”? y la solución x = A7!b, 


Conjunto de problemas 1.5 


1. ¿Cuándo es no singular una matriz triangular superior (un conjunto completo de pivo- 
tes)? 

2. ¿Qué múltiplo £32 del renglón 2 de A resta la eliminación del renglón 3 de A? Use la 
forma factorizada 


A = 


E 


¿Cuáles son los pivotes? ¿Se requiere un intercambio de renglones? 


3. Multiplique la matriz L = E7*F”*G”! en la ecuación (6) por GFE en la ecuación (3): 


1 0 0 E-0: 0 
Z 1 Oj multiplicada por |-2 1 01]. 
-=1 -—] 1 -1 11 


También multiplique en orden opuesto. ¿Por qué las respuestas son iguales? 
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4. Aplique eliminación para obtener los factores L y U de 


a e O! ds 
a= 57 y A=|1 3 1 O E 
E 14 08 


5. Factorice A en LU, y escriba el sistema triangular superior Ux = c que aparece después 
de la eliminación, para 





. nm 4 , , m7 pe 7 Y 7) MOTA IT ON Ar ces 
CASTA ARA A OS A CLON ESOO ALO 
>) Ms Y A 3 e P > , EAS ASA 
ORTA el ect OS A 4 a : IAN 





SS E u 2 
Ax=10 5 7 vi=12L 
6.9 3 w 5 
6. Encuentre E? y Edy E”? si 
1 0 
EE | . q 
7. Encuentre los productos FGH y HGF si (donde se han omitido los ceros triangulares 
superiores) 
1 1 1 
E NE! 0 o NE ls + E | 
¿a OS RE E A O 
000 1 9202041 A O A | 


8. (Segunda demostración de A = LU) El tercer renglón de U proviene del tercer renglón 
de A al restar múltiplos de los renglones 1 y 2 (¡de UT): 
renglón 3 de U = renglón 3 de A — £z ¡(renglón 1 de U) — £32(renglón 2 de U). 


a) ¿Por qué se restan renglones de U y no de A? Respuesta: Debido a que en ese mo- 
mento se utiliza un renglón pivote 





AAA ERRE ER REASON 


b) La ecuación anterior es la misma que 


renglón 3 de A = £,,(renglón 1 de U) — £.,(renglón 2 de U) + l(renglón 3 de U). . 
¿Qué regla de la multiplicación de matrices multiplica por U este renglón 3 de L? E 
Los otros renglones de LU coinciden de manera semejante con los renglones de A. : 
9. a) ¿En qué condiciones el siguiente producto es no singular? E 
O E e A A E 
ÓN El. 1.0 da 0 1 —1]. E 

0 -—1 1 d; 00-00 1 





b) Resuelva el sistema Ax = b empezando con Le = b. 


1 0 0 Ci 0 
—-1 1 0 ES 0| =b. 
oO —1 1 C3 1 


10. a) ¿Por qué para resolver cada uno de los sistemas Lc = b y Ux = c se requieren apro- 
ximadamente n”/2 pasos de multiplicación-sustracción? 
b) ¿Cuántos pasos requiere la eliminación para resolver 10 sistemas con la misma ma- 
triz de coeficientes A de 60 por 607 


PECRNIRSLIEAAELERVAAÁOANUAS 





a 
y 
E 
4 
A 
E 
É 
j 
E 
4 
Ze 


11. 


12. 


13. 


14. 


15: 


16. 


1% 


18. 


19. 
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Resuelva lo siguiente como dos sistemas triangulares, sin multiplicar LU para encon- 
trar Á: 
ll USO 2 4 4]| lu 2 
LUx=j|1 1 0/0 1 2| jul =|O0l. 
ROTA 00 w 2 
¿Cómo es posible factorizar A en un producto UL, triangular superior multiplicado por 
un sistema triangular inferior? ¿Tendrían los mismos factores que en A = LU? 
Resuelva lo siguiente por eliminación, intercambiando renglones cuando sea necesario: 
u + 4vu + 2w = -—2 v+w=0 
—2u — 8v + 3w = 32 y PE =0 
v+ouwo= 1 DADA aL. 
¿Qué matrices de permutación se requieren? 
Escriba todas las matrices de permutación de 3 por 3, incluyendo P = /. Identifique 
sus inversas, que también son matrices de permutación. Las inversas satisfacen 
PP”* = |, y están en la misma lista. 
Encuentre (y compruebe) las factorizaciones PA = LDU para 
3 | 1 
A=41 O 1 y A=/42 4 2]. 
A ¡AU ES: 
Encuentre una matriz de permutación de 4 por 4 que requiera tres intercambios de ren- 
glones para llegar al final de la eliminación (que es U = P. 
La forma menos conocida A = LPU intercambia renglones sólo al final: 
A ISO ¡US 00 1 LB 
A=|1 1 3| >£ A=/0 0 2|=PU=]J0 O 1] ]/0 3 61. 
ES A >> 0 1 0 0-0. 2 
¿Cuál es L en este caso? Al comparar con PA = LU en el recuadro 1J, ahora los mul- 
tiplicadores permanecen en Su sitio (£,, es 1 y £3, es 2 cuando A = LPUO). 
Decida si los siguientes sistemas son singulares o no singulares, y si no tienen solu- 
ción, una solución o una infinidad de soluciones: 
vo ovw=2 vv w=0 vrwwvw=1 
u— Y =2 y uUu-—wu = 0 Y uJx+DV =] 
u =w-=2 u =-w=0 u +u =l 
¿Cuáles números a, b, c conducen a intercambios de renglones? ¿Cuáles hacen singu- 


lar a la matriz? 


LAO c 2 
A=la 38 3 y a=|: 2 
0 boa 


pa A 


42 


Capítulo 1 Matrices y eliminación gaussiana 


En los problemas 20 a 31 se calcula la factorización A = LU (y también A = LDU), 





20. La eliminación hacia adelante cambia E JE = bauna triangular le El x=C: 
x+ y=5 A A+ y SS A EA IES 
x+2y=7 y=2 E OZ 
Ese paso restó £,, = veces el renglón 1 del renglón 2. El paso inverso suma f.; 
veces el renglón l al renglón 2. La matriz para ese paso es L = . Al multiplicar 
esta L por el sistema triangular [, ¡]x = [3] se obtiene = . En otras 








palabras, L multiplica a Ux = c para obtener 


21. (Cambio a 3 por 3) La eliminación hacia adelante cambia Ax = b a un sistema trian- 
gular Ux =cC: 


x+ y+ 2=5 x+ y+ z2=5 ESA ZE 
x+2y+32=?7 y +2z=2 y +27 =2 
x + 3y +6z = 11 2y +52=6 z =2, 


La ecuación z = 2 en Ux = c proviene de la ecuación original x + 3y + 6z = 11 en 
Ax = bal restar £3, = veces la ecuación 1 y £32 = veces la ecuación fi- 
nal 2. Lo anterior se invierte para recuperar [1 3 6 l1]en[A b]dela[1 1 1 5] fi- 
nal y [0 1 22 y[0 0 1 21en1U c]: 


Renglón 3 de [4 b] = (£3, renglón 1 + £,, renglón 2 + 1 renglón 3) de [U cl]. 





En notación de matrices, esto es una multiplicación por £. Así, A = LU y b = Lc. 


22. ¿Cuáles son los sistemas triangulares de 3 por 3 Lc = b y Ux = c del problema 21? 
Compruebe que c = (3, 2, 2) resuelve el primero, ¿Cuál es el vector x que resuelve el 
segundo? 


23. ¿Cuáles son las dos matrices de eliminación E», y Ez, que transforman la matriz A en 
la forma triangular superior Ez2E,,¡A = U? Multiplique por Ez, y Ez," para factori- 
zar Aen LU ETE U: 


E 
A=|2 4 51. 
0.4.0 


24, ¿Cuáles son las tres matrices de eliminación E»¡, Ez, y Ez, que transforman la matriz 
A en la forma triangular superior Ez2E3¡£,¡4 = U? Multiplique por Ex, Ez, y Ez, 
para factorizar A en LU, donde L = E;;' E; Ez7. Encuentre L y U: 


1 O 
AFMUZ LO 
314 5 


25. Cuando en la posición pivote aparece un cero, ¡A = LU no es posible! (Se requieren 
pivotes diferentes de cero d, f, i en U.) Demuestre directamente por qué los dos casos 
siguientes son imposibles: 


o 1 O E y: CA E 1 de e: 58 
a f Lp A 2 Lo 1 $ ed 
PoZ A m n 1 Í 


26. ¿Qué número c produce un cero en la segunda posición pivote? Se requiere un inter- 
cambio de renglones y A = LU no es posible. ¿Qué número c produce un cero en la 








A A A A AAA A 


27. 


28. 


29 


o 


31. 


32 


33 


4 


e 


d11738 
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tercera posición pivote? Así, un intercambio de renglones no puede ayudar y la elimi- 
nación falla: 


oc 0 
A=1|12 4 1l 
E O 


¿Cuáles son L y D para esta matriz A? ¿Cuál es UenA = LU y cuál es la nueva U en 
A = LDU? 
2 4 8 
A=|0 3 91 
A 


A y B son simétricas a través de la diagonal (porque 4 = 4), Encuentre sus factoriza- 
ciones triples LDU, y escriba cómo está relacionada U con £L para estas matrices simé- 


tricas: 
1.4 0 
A= y 6 y B=|4 12 41, 
0 4 0 
(Recomendado) Calcule L y U para la matriz simétrica 


a 


an2n a 
SNS 
0-7 ¡NS 
A O 2 


Encuentre cuatro condiciones sobre a, b, c, d para obtener A = LU con cuatro pivotes. 


Encuentre £ y U para la matriz no simétrica: 
> O NA E y 
ME E E E 
daa A RE E 
10 A ES 


Encuentre cuatro condiciones sobre a, b, c, d, r, s, t para obtener A = LU con cuatro 
pivotes. 


Las matrices tridiagonales tienen elementos iguales a cero, excepto en la diagonal prin- 
cipal y en las dos diagonales adyacentes. Factorice lo siguiente en A = LU y A = LDV: 
1 PR a a 0 
A=J|1 2 1 y A=la art+b be Te 
WI 0 b DC 


Resuelva el sistema triangular Le = b para encontrar c. Luego, resuelva Ux = c para 
encontrar x: 


e ao O a 
lo] y uo y e- Li 


Por seguridad, encuentre A = LU y resuelva Ax = b como de costumbre. Identifique 
c cuando lo vea, 


Resuelva Le = b para encontrar c, Luego resuelva Ux = c para encontrar x. ¿Cuál era 
la matriz A? 
1 0-70 E: Al 4 
L=|$1 1 0 y U=j0 1 1 y b=iS|. 
a A. 0007 6 
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34. SiA y B tienen elementos distintos de cero en las posiciones indicadas con x, ¿qué ce- | 
ros siguen siendo ceros en sus factores L y U? 


> NS ES > o O E E 
o 0 E E e UP E 0 ES 
0 (CS MO A A O AO 
A e AND AS - JAS ES ES 


35. (Importante) Si A tiene pivotes 2, 7, Ó sin intercambios de renglones, ¿cuáles son los 
pivotes para la parte superior izquierda de la submatriz B de 2 por 2 (sin el renglón 3 
y la columna 3)? Explique su respuesta. 


36. Empezando con una matriz A de 3 por 3 con pivotes 2, 7, 6, añada un cuarto renglón * 
y una Cuarta columna para obtener M. ¿Cuáles son los tres primeros pivotes de M, y 
por qué? ¿Cuáles son el cuarto renglón y la cuarta columna que aseguran la obtención 
de un 9 en el cuarto pivote? 


37. Use chol(pascal(5)) para encontrar los factores triangulares de pascal(5) de MATLAB. 
¡Intercambios de renglones en [£, U] = lu(pascal(5)) arruinan el patrón de Pascal! 


38. (Repaso) ¿Para qué números c es imposible A = LU con tres pivotes? 


1 Y 
A=i3 Cc 11 
0 ET 


39. Calcule la diferencia temporal para cada nuevo miembro derecho b cuando n = 800, 
Establezca A = rand(800), b = rand(800,1) y £B = rand(800,9). Compare los tiem- 
pos de tic; Alb; toc y tic AMB; toc (que resuelve para 9 miembros derechos). 





Los problemas 40 a 48 son sobre matrices de permutación. 


40. Hay 12 permutaciones “pares” de (1, 2, 3, 4) con un número par de intercambios. Dos 
de éstas son (1, 2, 3, 4) sin intercambios y (4, 3, 2, 1) con dos intercambios. Enumere 
los otros 10. En vez de escribir cada matriz de 4 por 4, use los números 4, 3, 2, 1 pa- 
ra proporcionar la posición del 1 en cada renglón. 


41. ¿Con cuántos intercambios se permuta (5, 4, 3, 2, 1) de vuelta a (1, 2, 3, 4,5)? ¿Cuán- 
tos intercambios son necesarios para ir de (6, 5, 4,3, 2, 1) a (1, 2, 3, 4, 5, 6)? Uno es 
par y el otro es impar. Para ir de (n,...,1)a(l,...,n), demuestre que n = 100 y 
101 son pares, y que 1 = 102 y 103 son impares. 


. Z % SEO Es .. £ z y A a ei NS de 
a sei [os e ! ESTAS A LD A SO NR A as O E 
A is di a dl tes e ds RUSA .. . L AN 


42. SiP;, y P¿son matrices de permutación, también lo es P,P,. Esta última matriz sigue 
teniendo los renglones de / en algún orden. Proporcione ejemplos con P,P, % P,P, y 
P 3P a P Ade 3. 


rta Udo dos 
a cl rito ade! 


43. (Intente responder esta pregunta). ¿Cuál es la permutación que hace triangular supe- 
rior a PA? ¿Cuál es la permutación que hace triangular inferior a P, AP,? Al multipli- 


car A por la derecha por P, se intercambia el de A. a 
E 
9-0 6 E 
A=|1 2 31. 
0074-35 


44. Encuentre una matriz de permutación de 3 por 3 con P? = ] (pero no P = )). Encuen- 
tre una permutación de 4 por 4 P con P*xX TI. 
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45. Si se toman potencias de una permutación, ¿por qué alguna P* termina siendo igual a 
T? Encuentre una permutación de 3 por 3 P de modo que la menor potencia que es 
igual a 7 es P*, (Éste es un problema de desafío. Combine un bloque de 2 por 2 con un 
bloque de 3 por 3.) 


46. La matriz P que multiplica a (x, y, z) para obtener (z, x, y) también es una matriz de 
rotación. Encuentre P y P?. El eje de rotación a = (1, 1, 1) no se mueve, y es igual a 
Pa. ¿Cuál es el ángulo de rotación de v = (2, 3, —-5)aPv = (—Í, 2, 3)? 


47. Si P es cualquier matriz de permutación, encuentre un vector x diferente de cero de 
modo que (1 -— Pjx = 0. (Esto significa que l — P no tiene inversa, y que su determi- 
nante es Cero). 


48. Si P tiene 1s en su antidiagonal desde (1, n) hasta (n, 1), describa PAP. 





1.6 INVERSAS Y TRASPUESTAS 


La inversa de una matriz de n por n es otra matriz de n por n. La inversa de A se denota por 
A”? (lo cual se lee “A inversa”). La propiedad fundamental es sencilla: Si se multiplica por 
A y luego se multiplica por A7*, se regresa a la posición inicial: 


Matriz inversa Si b = Ax, entonces A“!b= x. 


Así, ATLAx = x. La matriz A”? multiplicada por la matriz A es la matriz identidad. No to- 
das las matrices tienen inversas. Una inversa es imposible cuando Ax es cero y x es di- 
ferente de cero. Por tanto, A7* debería tener que regresar de Ax = 0 a x. Ninguna matriz 
puede multiplicar ese vector cero Ax y producir un vector x diferente de cero. 

Los objetivos son definir la matriz inversa, calcularla y aplicarla, cuando A”! existe, 
y a di cuáles matrices no tienen inversas. 





Nota 1 La inversa existe si y sólo si la eliminación produce n pivotes (se permiten inter- 
cambios de renglones). La eliminación resuelve Ax = b sin encontrar explícitamente A”? 


Nota 2 La matriz A no puede tener dos inversas distintas. Suponga que BA = / y también 
que AC = /. Entonces B = C, según la siguiente “demostración por paréntesis”: 


B(AC) = (BA)C proporciona Bl = IC, que es B = C. (2) 


Esto demuestra que una inversa izquierda B (que multiplica por la izquierda) y una inver- 
sa derecha C (que multiplica a A por la derecha para obtener AC = [) deben ser la misma 


matriz. 


Nota 3  SiA es invertible, la sola y única solución de Ax = besx = A7!b: 


¡por A: =2, entonces x = Y “6 S = Ab. 





Nota 4 (Importante) Suponga que hay un vector x diferente de cero tal que Ax = 0. En- 
tonces A no puede tener inversa. Para repetir: Ninguna matriz es capaz de regresar el V a x. 


Si A es invertible, entonces Ax = O sólo puede tener la solución x = 0. 
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Nota 3 Una matriz de 2 por 2 es invertible si y sólo si ad — bc es diferente de cero: 


00 E d —b 
Inversa de 2 por 2 p A E da e: (3) 


El número ad — be es el determinante de A. Una matriz es invertible si su determinante es 
distinto de cero (véase el capítulo 4). En MATLAB, la prueba de invertibilidad consiste en 


encontrar n pivotes diferentes de cero. La eliminación produce estos pivotes antes de que 
aparezca el determinante. 


Nota 6 Una matriz diagonal tiene una inversa en el supuesto de que ninguno de los ele- 
mentos diagonales es cero: 
d 1 1/ d 1 
Si A= a entonces A”! = se Y AA 
d 1/d, 
Cuando están implicadas dos matrices, no hay mucho que hacer sobre la inversa de 
A + B. La suma puede o no ser invertible. En vez de lo anterior, la fórmula clave en cálcu- 
los matriciales es la inversa de su producto, AB. Los números normales son los mismos: 
(a + by”? es difícil de simplificar, mientras l/ab se separa en 1/a veces 1/b. Sin embargo, 
para matrices el orden de la multiplicación debe ser correcto: si ABx = y, entonces Bx = 
ATly yx = B7147?y. Las inversas se pscnian en orden opuesto. 


AL Un producto 4 AB de matrices “invertibles es s invertido por BAC 


* Inversa é de AB AB) = plan E 0) 


Do saación Para demostrar que B7!A4”! es la Desa de AB, las matrices se multipli- 
can y se aplica la ley asociativa para quitar los paréntesis. Observe que B se escribe al la- 
do de B”!: 

(ABXABTA7D) =ABBAT! =ATA A? =ApAT=!I 


(BUATDC(AB) = BUATIAB = B7UIB=BUB=L. E 


Una regla semejante se cumple para tres o más matrices: 
Inversa de ABC” (ABC)! = CBA! 
Este cambio de orden se vio cuando las matrices de eliminación E, E y G se invirtieron pa- 
ra regresar de U a A. En la dirección hacia adelante, GFEA era U. En la dirección hacia 


atrás, L = ET *F7*G”? era el producto de las inversas. Debido a que al último aparece G, 
entonces G7* aparece primero. Por favor compruebe que A” ' sería UT1GFE. 


Cálculo de A7?: El método de Gauss-Jordan 


Considere la ecuación A47* = /. Si se toma una columna a la vez, la ecuación determina 
cada columna de A7*. La primera columna de A” * se multiplica por A, para producir la pri- 
mera columna de la identidad: Ax, = €,. De manera semejante, Ax, = €, y Axz = ez; las 
es son las columnas de /. En un ejemplo de 3 por 3, A multiplicada por A? es [. 


2 A E 10.0 
ÁX; = €7 4 —6 0 EAU E e AA o E: o A O E Op (5) 
2 CS Ot cral 


ES QUIE: y OEA CO 











«a 


en Y 
ANS 
AAN Ela 

A 
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Así, se tienen tres sistemas de ecuaciones (o n sistemas). Todos tienen la misma matriz de 
coeficientes A. Los miembros derechos e,, €, e3, son diferentes, aunque la eliminación es 
posible en todos los sistemas de manera simultánea. Éste es el método de Gauss-Jordan. 
En vez de detenerse en U y cambiar a sustitución hacia atrás, continúa restando múltiplos 
de un renglón de los renglones de arriba. Esto produce ceros arriba de la diagonal, y tam- 
bién abajo de ésta. Cuando ¡lega a la matriz identidad, se ha encontrado A” ?. 

El siguiente ejemplo preserva todas las tres columnas e;, €», ez, y opera sobre renglo- 
nes de longitud igual a seis: 


Aplicar el método de Gauss-Jordan para encontrar A7* 


a E E A O 
[A e e e] =| 4-6 0 0 1 0 
ar ES PAN CA O AS | 
> ES O + 0 
Pivote =2 => ¡0 -8 -2 -2 1 0 
0078 3 «1 1 


0 
Pivote =-8> [0 -8-2 2 1 0|=[(U £”!]. 
0. 0 1-1 1 1 


Esto completa la eliminación hacia adelante, de la primera mitad. La triangular superior 
U aparece en las tres primeras columnas. Las otras tres columnas son las mismas que en 
L7?. (Éste es el efecto de aplicar las operaciones elementales GFE a la matriz identidad). 
Luego, la segunda mitad regresa de U a / (al multiplicar por U”*), Esto lleva L7! a 
UT1L7?, que es A7?. Creando ceros arriba de los pivotes se llega a A”!: 


2 1 0 2-1 -—] 
Segunda mitad [U LL"! > [0-8 0-4 3 2 
0 0 1-1 1 1 
2 5 _6 
2 e A 
ceros arriba de los pivotes —> |Q -8 0 -4 32.9 
O 0 1-1 E 
$ 6 
1.0.0 E-á-é 
se divide entre los pivotes > |0 1 0 $ —¿ —¿| =[I A“7!) 
0 0 1-1 1 1 


En el último paso, los renglones se dividieron entre sus pivotes 2 y —8 y 1. La matriz de 
coeficientes en el miembro izquierdo se transformó en la identidad. Debido a que A se con- 
virtió en 7, las mismas operaciones en el miembro derecho deben llevar 7 a A”*. En conse- 
cuencia, se ha calculado la inversa. 


Una nota para el futuro: El lector puede ver el determinante —16 que aparece en los de- 
nominadores de 47 *. El determinante es el producto de los pivotes QX—8(). Entra al 
final cuando los renglones se dividen entre los pivotes. 


Observación 1 A pesar de este brillante éxito al calcular A7*, no lo recomiendo. Admito 
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| que A”! resuelve en un paso Ax = b. Dos pasos triangulares son mejores: 


x = A7*b se separa en Lc = b y Ux= c. 


tas matrices L”* y U7* no se formaron de manera explícita, y en el cálculo verdadero, no 
deben formarse. Hacerlo sería una pérdida de tiempo, ya que sólo se requiere sustitución 
hacia atrás para x (y la sustitución hacia adelante produjo c). 

Una observación semejante es válida para A”; la multiplicación A” *b seguiría requi- 
riendo n? pasos. Lo que se busca es la solución, no todos los elementos de la inversa. 


| Puede escribirse c = L”1b y luego x = U"*e = U7*L7*b. Sin embargo, observe que es- 
| 


Observación 2 Sólo por curiosidad, podría contarse el número de operaciones necesa- 
rias para encontrar A”*, La cuenta normal para cada nuevo miembro derecho es n?, la mi- 
tad en la dirección hacia adelante y la mitad en la sustitución hacia atrás. Con n miembros 
derechos €,, .. ., e, esto hace n”. Luego de incluir las n*/3 operaciones sobre A misma, 
parece que el total es 4n*/3. 


Este resultado es ligeramente elevado debido a los ceros en los e;. La eliminación ha- 
cia adelante cambia sólo los ceros que están debajo del 1. Esta parte sólo tiene n — j compo- 
nentes, de modo que la cuenta para las e, cambia efectivamente a (n — JY12. Al sumar sobre 
todas las j, el total para la eliminación hacia adelante es 1/6. Esto debe combinarse con las 
n"/3 operaciones de costumbre que se aplican a A, y los n(n”/2) pasos de la sustitución ha- 
cia atrás que finalmente producen las columnas x, de A” *. La cuenta final de multiplicacio- 
nes para calcular A7* es n? 





s* 
e 


' E 2 . 
e Conteo de operaciones E EN 3 +n (5) a ÓS 
Este conteo es extraordinariamente bajo. Debido a que la multiplicación de matrices 
consume »? pasos, ¡requiere tantas operaciones para calcular A? como las necesarias para 
calcular A”?! Este hecho parece casi increíble (y calcular 4? requiere el doble, hasta don- 

de puede verse). A pesar de lo anterior, si A7* no es necesaria, no debe calcularse. 


¿ 

Observación 3 En el cálculo de Gauss-Jordan, siempre se fue en busca de U, antes de ini- 
| ciar el procedimiento hacia atrás para obtener ceros arriba de los pivotes. Esto es como la 
| eliminación gaussiana, aunque también son posibles otros órdenes. Hubiera podido utilizar- 
i se el segundo pivote cuando se estaba ahí antes, con la finalidad de obtener un cero arriba 
| del pivote, así corno también abajo de él. Esto no es inteligente. En ese instante el segundo 
| renglón está virtualmente lleno, mientras cerca del extremo tiene ceros provenientes de las 
| operaciones en renglones hacia arriba que ya se habían realizado. 


Invertíble = No singular (n pivotes) 


En última instancia, lo que se quiere saber es cuáles matrices son invertibles y cuáles no lo 
| son. Esta cuestión es tan importante que tiene muchas respuestas. ¡Consulte la última pá- 
| gina del libro! | 

En cada uno de los cinco primeros capítulos se proporciona una prueba diferente 
(aunque equivalente) para comprobar la invertibilidad. Algunas veces las pruebas se ex- 
tienden a matrices rectangulares e inversas por un lado: el capítulo 2 investiga el tema de 
renglones y columnas independientes. En el capítulo 3 se invierte AA? o AYA. En los otros 
capítulos se abordan los determinantes diferentes de cero, los valores característicos di- 
ferentes de cero o los pivotes diferentes de cero. Esta última prueba es la que se encuen- 
tra en la eliminación gaussiana. Se quiere demostrar (en unos cuantos párrafos teóricos) 
que la prueba de los pivotes es exitosa. 


A 








1.6  Inversas y traspuestas 49 


Suponga que A cuenta con un conjunto completo de pivotes. AA”? = / proporciona n 
sistemas Áx; = e; por separado para las columnas de 4” ?. Estos sistemas pueden resolver- 
se por eliminación o por Gauss-Jordan. Pueden requerirse intercambios de renglones, pero 
las columnas de A”? están determinadas. 

Hablando estrictamente, es necesario demostrar que la matriz A”? con esas columnas 
también es autoinversa. Al resolver AA”? = ] se resuelve al mismo tiempo A7!A = £ pero, 
¿por qué? Una inversa por un lado de una matriz cuadrada, es automáticamente una 
inversa por dos lados. Para ver por qué, observe que todo paso de Gauss- Jordan es una 
multiplicación por la izquierda por una matriz elemental. Se están permitiendo tres tipos de 
matrices elementales: 


1. E, para restar un múltiplo £ del renglón ¡ del renglón 1. 
2.  P, para intercambiar los renglones ! y j. 
3. D(oD”?) para dividir todos los renglones entre sus pivotes. 


El proceso de Gauss-Jordan en realidad es una secuencia gigantesca de multiplicaciones de 
matrices: 


(DA Pa NAS (6) 


La matriz entre paréntesis, a la izquierda de A, ¡evidentemente es una autoinversa! Por la 
nota 2, existe, y es igual a la inversa derecha, de modo que toda matriz no singular es in- 
vertible. 

La conversa también es verdadera: Si A es invertible, tiene n pivotes. En un caso ex- 
tremo que es claro: A no puede tener toda una columna de ceros. La inversa jamás podría 
multiplicar una columna de ceros para producir una columna de /. En un caso menos ex- 
tremo, suponga que la eliminación inicia en una matriz invertible A, pero que falla en la co- 
lumna 3: 


d; DA ES 
Falla añ O da x x 
En la colunma 3 no hay pivote 0 0000% 
ES E A O 


Esta matriz no puede tener una inversa, sin importar cuáles sean las x. Una demostración de 
este hecho es aplicar operaciones en las columnas (¿por primera vez?) con la finalidad 
de hacer cero toda la columna. Al restar múltiplos de la columna 2 y luego de la columna 1, 
se llega a una matriz que ciertamente no es invertible. En consecuencia, la matriz original A 
no es invertible. La eliminación proporciona una prueba completa: Una matriz de n por n es 
invertible si y sólo si tiene n pivotes. 


La matriz traspuesta 


Se requiere una matriz más, y por fortuna es mucho más sencilla que la inversa. La tras- 
puesta de A se denota por A*. Sus columnas se toman directamente de los renglones de A: 
el i-ésimo renglón de A se convierte en la i-ésima columna de A!*: 


Z2 14 o 
Traspuesta  SiA= entonces A* = |1 0Ll. 
0.03 4.3 


Al mismo tiempo, las columnas de A se convierten en los renglones de 4*. Si A es una ma- 
triz de m por n, entonces A* es de n por m. El efecto final es doblar la matriz respecto a su 
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diagonal principal, y el elemento en el renglón ¿, columna j de A* proviene del elemento 
que está en el renglón j, columna ide A: 


M 


Elementos de A* 





La traspuesta de una matriz triangular inferior es triangular superior. La traspuesta de A* 
lleva de regreso a A. 

Si se suman dos matrices y luego se traspone, el resultado es el mismo que si prime- 
ro se traspone y luego se suma: (A + B)* es lo mismo que A* + B”. Pero, ¿a qué es igual 
la traspuesta de un producto AB o de una inversa A7*? A continuación se presentan las 
fórmulas esenciales de esta sección: 











i) La traspuestade ABes (AB) = BA? 


1) La traspuesta de AT! est (A0)y" = (47.8 





A 


Observe el parecido de la fórmula para (AB)* con el resultado de la fórmula para (AB)”?. 
En ambos casos se invierte el orden, con lo que se obtiene BAY y B7147*, La demostra- 
ción para la inversa fue fácil, pero ésta requiere de una paciencia extraordinaria con la mul- 
tiplicación de matrices. El primer renglón de (AB)* es la primera columna de AB. Así, las 
columnas de A están ponderadas por la primera columna de B. Esto se suma a los renglo- 
nes de A* ponderados por el primer renglón de B*. Eso es exactamente el primer renglón 
de BYA”. Los otros renglones de (AB)* y BYA* también coinciden. 


y AB = LOUIS Sao 
Se empieza con a 555 
AZ 1 1 dy O 
Traspuesta de BYAT= 13 2 0 1 = 13 SÍ. 
ER NS, 


Con la finalidad de establecer la fórmula para (475*, se inicia con A47* =IyAT!A =1 
y se toman las traspuestas. En un miembro, 1* = 1. En el otro miembro, por el inciso ¿) se 
conoce la traspuesta de un producto. Puede verse cómo (47 5 es la inversa de A*, lo cual 
demuestra ¿1): 


Inversa de A* = Traspuesta de A7* (47594? =J1 (8) 


Matrices simétricas 


Una vez que se han establecido estas reglas, es posible presentar una clase especial de ma- 
trices; quizá la clase más importante de todas. Una matriz simétrica es una matriz que es 
igual a su propia traspuesta: AY = A. La matriz es necesariamente cuadrada. Cada ele- 
mento en un miembro de la diagonal es igual a su “imagen especular” en el otro lado: 
a; = A. Dos ejemplos sencillos son A y D (y también A”?): 


as dl A ES la PA 1_1|8 -—2 
Matrices simétricas AÁ= 5 3 y D= E A y AT= a E ll 


Una matriz simétrica no necesariamente es invertible; incluso, puede ser una matriz de ce- 
ros. Pero si AT? existe, también es simétrica. Con base en la fórmula ¿¿) anterior, la tras- 
puesta de A”* siempre es igual a (41)7!; para una matriz simétrica lo anterior es justo A7?. 
AT! es igual a su propia traspuesta; es simétrica siempre que A lo sea. Ahora se ha demos- 
trado que el resultado de multiplicar cualquier matriz R por R* es una matriz simétrica. 
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Productos simétricos RR, RRA", y LDL* 


Sea cualquier matriz R, quizá rectangular. Multiplique R* por R. Entonces el producto RTR 
es automáticamente una matriz simétrica cuadrada: 


La traspuesta de RTR es RURTY", que es RTR. (9) 


Esta es una demostración rápida de simetría para RTR. Su elemento i, j es el producto in- 
terno del renglón i de R* (columna ¿de R) con la columna ¡ de R. El elemento (j, ¿) es el 
mismo producto interno, la columna ¡ con la columna ¿. Así, RTR es simétrica. 

RR? también es simétrica, aunque diferente de RTR. En mi experiencia, la mayor par- 
te de los problemas científicos que empiezan con una matriz rectangular R terminan con 
RYR, con RR* o con ambas. 


R=[1 2] y RT= 0) producen RTR = P A y RR = [5]. 


El producto R*R es de n por n. En orden opuesto, R RT es de m por m. Incluso sim = n, 
no es muy probable que RTR = R RT. La igualdad puede ocurrir, aunque no es normal. 


Las matrices simétricas se presentan en todo tema cuyas leyes son justas. “Cada 
acción tiene una reacción igual y opuesta.” El elemento a, que proporciona la acción de 
sobre f es compensado por ay; Esta simetría se verá en la E sección, para ecuacio- 
nes diferenciales. Aquí LU pierde la simetría, pero LDL” la captura perfectamente. 





La traspuesta de A = LDU proporciona A* = UTDYET, Debido a que A = A?, ahora se tie- 
nen dos factorizaciones de A en triangular inferior multiplicada por triangular superior (L* 
es triangular superior con 1s en la diagonal, exactamente como U.) Debido a que la facto- 
rización es única (consulte el problema 17), LY debe ser idéntica a U. 


y en E > == I 


Cuando se aplica eliminación a una matriz simétrica, A* = A es una ventaja. Las matrices 
más pequeñas siguen siendo simétricas a medida que procede la eliminación, de modo que 
¡Es posible trabajar con la mitad de la matriz! El ángulo inferior del miembro derecho si- 
gue siendo simétrico: 


a b € 
a: ba 6 bp? bc 
E O 
a E dl 
b Z 
a 
a 


El trabajo de la eliminación se reduce de n*/3 a n*/6. No es necesario almacenar los ele- 
mentos de ambos lados de la diagonal, o de almacenar tanto a L como a U. 


o A 
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al Conjunto de problemas 1.6 


1. Encuentre las inversas (no se requiere ningún sistema especial) de 


OZ MR VAS __[|cosg —sen0 
4 => Sl 42 = |; 1, E ld poe] 


2. a) Encuentre las inversas de las matrices de permutación 
A E | 0 0 1 
P=J|J0 1 0 y P=|1 0 01. 
1! 0: 0 o 10 


b) Explique para permutaciones, por qué P”* siempre es igual a P*. Demuestre que los 
1s están en los sitios correctos para obtener PPY = 1 


3. A partir de AB = C, encuentre una fórmula para A7?. También encuentre A”? a partir 
de PA = LU, 


4. a) Si A es invertible y AB = AC, demuestre rápidamente que B = C. 
b) Si A = E ol encuentre un ejemplo con AB = AC, pero B % C. 


5. Si la inversa de A? es B, demuestre que la inversa de A es AB. (Por tanto, A es inverti- 
ble siempre que A? es invertible.) 


6. Aplique el método de Gauss-Jordan para invertir las siguientes matrices 


1:50:30 2 —1 0 0 0-1 
Á 1=|1 e E A A2= 4-1 2 -—1 : A3 = SE SS Y 
030 AL Ó -1 2 0 | 
7. Encuentre tres matrices de 2 por 2, que no sean A = / y A = —[, que sean sus propias 


inversas: 4? = 7. 


8. Demuestre que Á = | a ¿| no tiene inversa, resolviendo Ax = 0, y fallando al resolver 


lea e cad: 50 
SEE, na o 1! 
9. Suponga que la eliminación fracasa porque en la columna 3 no hay pivote: 


2 4 6 














Pivote faltante A = 





8 5 
0 T7| 
O 9 


O O yu is 


0 
0 
0 


Demuestre que A no puede ser invertible. El tercer renglón de A”*, multiplicado por A, 
debe proporcionar el tercer renglón [0 O 1 0] de 474 =1. ¿Por qué es imposible esto? 


10. Encuentre las inversas (de cualquier manera permitida) de 


OOO 1.0 0.0 fal b00:0 
00 2 == 1 0 0 cda 0.0 
a. = | 2 pr 
e E a E A e 
40 0 0 0 0-3 1 00. ed 


A A a A a AS A RS 


A IS 


e A A A A 


RIAD PATIO, 





11. 


12. 


13. 
14, 


15: 


16. 


Ey: 


18, 


19. 


20. 


PS NE EI oa al ORUGUAY 
EE A ; ; E A A Ad 
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e PERA. 
=* Li 
. 


Proporcione cluples dea y-B. tales.que A AN IGLATINA 
a) A + B no es invertible, aunque A y B sí lo son. 

b) A + Bes invertible, aunque A y B no lo son. 

c) Las tres 4, B, y A + B son invertibles. 

En el último caso su ATU(A+B)BB"?! =B"!+A7! para demostrar que 
C = BT! + A7? también es invertible y encuentre una fórmula para C7?, 

Si A es invertible, ¿qué propiedades de A siguen siendo verdaderas para A” *? 

a) A es triangular.  b) A es simétrica. Cc) A es tridiagonal. 

d) Todos los elementos de 4 son números enteros. 

e) Todos los elementos de A son fracciones (incluso los números como 2). 


Si A = [3] y B= [3], calcule 47B, BTA, AB" y BAT 


Si B es cuadrada, demuestre que A = B + B* siempre es simétrica, y K = B- B? siem- 

pre es simétrica sesgada, lo cual significa que K* = —K. Encuentre estas matrices A 

y Kcuando B = [ : al , y escriba B como la suma de una matriz simétrica y una ma- 

triz simétrica sesgada. 

a) ¿Cuántos elementos pueden elegirse independientemente en una matriz simétrica 
de orden n? 

b) ¿Cuántos elementos pueden elegirse independientemente en una matriz simétrica 
sesgada (K* = —K) de orden n? ¡La diagonal de K es cero! 


a) Si A = LDU, con 1s en la diagonal de £ y U, ¿cuál es la factorización correspon- 
diente de AT? Observe que A y A* (matrices cuadradas sin intercambios de renglo- 
nes) comparten los mismos pivotes. 


b) ¿Con qué sistemas triangulares se obtiene la solución de A* y = b? 
SIA = L,¡D,U, yA El L¿D,U», demuestre que £, = Lo, Di . D, 63 O, en Uz, Si A es 
invertible, la factorización es única. 


a) Deduzca la ecuación L¡*L¿D, = D¡U,U5?, y explique por qué un miembro es 
triangular inferior y el otro es triangular superior. 


b) Compare las diagonales principales, y luego compare el resto de las matrices. 


¿Cuáles son las condiciones sobre los elementos de A y B para que éstas sean in- 
vertibles? 


a DE a b 0 
A=id e O B=kc d 0l. 
JA 0.0 e 
Compruebe la factorización simétrica LDL* de 
AS 17) 
ASS A: PS y a= |; A: 
5 18 30 
Encuentre la inversa de 1.000 
qa a to 00 
e 1 
503 10 
ca 
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21. 


22. 


23. 


25. 


26. 


27 


+ 


28. 


29. 
30 
31. 


32 


(Extraordinario) Si A y B son matrices cuadradas, demuestre que / — BA es invertible 
si 7 — AB es invertible. Empiece con BU -— AB) = (Y — BAJB. 


Encuentre las inversas (directamente o a partir de la fórmula de 2 por 2) de A, B, C: 
DS uNa 0D _ 43 4 
als » albo » c-l7 


É 
Resuelva para las columnas de A7* = P | 


o 30- > 0-0 


. Demuestre que E ¿| no tiene inversa tratando de resolver para la columna (x, y): 


E d6 dd ema E] L 


(Importante) Si A es tal que renglón 1 + renglón 2 = renglón 3, demuestre que A no 
es invertible: 

a) Explique por qué Ax = (1, O, 0) no puede tener una solución. 

b) ¿Qué miembros derechos (b,, ba, b3) pueden permitir una solución a Ax = b? 

Cc) ¿Qué ocurre al renglón 3 en la eliminación? 


Si A es tal que columna 1 + columna 2 = columna 3, demuestre que A no es invertible: 

a) Encuentre una solución x diferente de cero de Ax = 0. La matriz es de 3 por 3. 

by La eliminación preserva columna 1 + columna 2 = columna 3. Explique por qué 
no hay un tercer pivote. 


Suponga que Á es invertible y que sus dos primeros renglones se intercambian para ob- 
tener B. La nueva matriz B, ¿es invertible? ¿Cómo puede obtenerse B”? a partir de A7*? 


Si el producto M = ABC de tres matrices cuadradas es invertible, entonces A, B, C son 
invertibles. Encuentre una fórmula para B”* que implique a M”?, A y C. 


Demuestre que una matriz con una columna de ceros no puede tener una inversa. 


Multiplique [% 5] por [_* 


es ue . ¿Cuál es la inversa de cada matriz si ad % bc? 
a) ¿Qué matriz E tiene el mismo efecto que los siguientes tres pasos? Reste el renglón 
1 del renglón 2, reste el renglón 1 del renglón 3, y luego reste el renglón 2 del ren- 


glón 3. 


b) ¿Qué simple matriz £ tiene el mismo efecto que los siguientes tres pasos inversos? 
Sume el renglón 2 al renglón 3, sume el renglón 1 al renglón 3, y luego sume el ren- 
glón 1 al renglón 2. 


Encuentre los números a y b con los que se obtiene la inversa de 5*eye(4) ones(4, 4): 


atra Te bobo 
Al  lba bb 
=1l-1 4-1l| 7 1b ba mbl 
=1l -1 -1 4 D "bb a 


¿Cuáles son a y b en la inversa de 6*eye(5) ones(5, 5)? 


q qqIIITP—>—ot A 
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33. Demuestre que A = 4*eye(4) — ones(4, 4) no es invertible: Multiplique A*ones(4,1). 


34. Hay 16 matrices de 2 por 2 cuyos elementos son 1s y Os. ¿Cuántas de estas matrices 
son invertibles? 


Los problemas 35 a 39 son sobre el método de Gauss-Jordan para calcular 47?, 


35. Transforme len A7* a medida que reduce A a / (por medio de operaciones en los ren- 
glones): 


an=jd y tana= Bs 


36. Imite el ejemplo de 3 por 3 del texto, pero con un signo + en A. Elimine por arriba y 
por abajo de los pivotes para reducir [4 Na [/ A 


0.0 


2 OS 3d 
E 03 HESSO%: 


[A 1] =|(1 2 
0.1 2.0.0 1 


| 
| 
| 
| 
37. Aplique eliminación de Gauss-Jordan sobre [A 1] para resolver AA”? = 1: | 
| 
| 


ab E-Ur-0 
O 1 cl ix xa xa =|0 1 0l 
O A | o O 1 


38. Invierta las siguientes matrices por eliminación de Gauss-Jordan, empezando con [4 1]: 


10D o: 
A=|2 1 3 A O 
0 071 AR 


39. Intercambie renglones, y prosiga con eliminación de Gauss-Jordan para encontrar 


A 
OO 
pa n=) ZO q 


40. ¿Falso o verdadero? (proporcione un contraejemplo si es falso y una explicación si es 
verdadero): 


a) Una matriz de 4 por 4 con un renglón de ceros no es invertible. 
by) Una matriz con 1s abajo de la diagonal principal es invertible. 
c) Si A es invertible, entonces 4”? es invertible. 


d) Si A* es invertible, entonces A es invertible. 


41. ¿Para cuáles tres números c la siguiente matriz, no es invertible? ¿Por qué? 


A E 
A=lc e cl. 
Ss $ oc 


de 
l 
nan 
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43. La inversa de la siguiente matriz es extraordinaria. Encuéntrela por eliminación sobre 
[A 1]. Extienda lo anterior a una “matriz alternante” de 3 por 3, y conjeture su inversa: 


A A EE 
JO 1-1. 1 
O 


LES $ JE $ CS 


44. Si B tiene las columnas de Á en orden invertido, resuelva (A — Bix = O para demostrar 
que A — B no es invertible. Un ejemplo lo conducirá a x. 


45. Encuentre y compruebe las inversas (suponiendo que existen) de las siguientes matri- 


ces en bloque: 
T 0 A 0 o 1 
€ 1 ES 0 TI DF 


46. Use inv(S) para invertir la matriz simétrica MATLAB de 4 por 4 S = pascal(4). Ob- 
tenga la matriz Pascal triangular inferior A = abs(pascal(4,1) y test inv(S) = inv(A”)* 
inv(A). 

47. Si A = ones(4,4) y b = rand(4,1), ¿cómo le hace saber MATLAB que Ax = b no tiene 
solución? Si b= ones(4,1), ¿qué solución de Ax = b se encuentra por medio de A1b? 





(SNE ad at os 
AA ALA A VIA - 


«hh, ts 0 e PC ur. OTI ' A, 3 : - o . y ii se ne » dj sd 7 ssl PY 


48. M7? muestra el cambio en A”? (lo cual es útil saber) cuando una matriz se resta de A. 
Compruebe el siguiente inciso 3 cuidadosamente, multiplicando M M7! para obtener 1: 


csi 1. M=I—uv* y MU =I+uvi/(—vwu). 
| 2. M=A-—uv* y MA=A THAT tA 7/1 —vTA 7). 
3. M=I-—UV y MU =I +U(Ln - VUy'V. 
4 M=A-=UW"V y M?A=A47?*+ATFU(W-VATUy var. 
Las cuatro identidades provienen del bloque 1, 1 luego de que se invierten las siguien- 
tes matrices: 


ri id ba Las 


Los problemas 49 a 55 son sobre las reglas para trasponer matrices. 
49. Encuentre AY y A“! y (47 y (4D)? para 
do 0 2 o O 
A = p | y también A= b ol 


50. Compruebe que (4B)' es igual a BYA*, aunque éstas son diferentes de A*TB*: 


Ed bd -L3 


En caso de que AB = BA (¡lo cual en general no es cierto!), ¿cómo puede demostrar 
que BYA* = ATB?? 
51. a) La matriz ((AB)7*)* proviene de (A7%* y (B7 MY. ¿En qué orden? 


b)Si U es triangular superior, entonces (UB es triangular. 





52. Demuestre que A? = 0 es posible pero 44 = 0 no es posible (a menos que A = ma- 
tr1z cero). 
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53. a) Al multiplicar el vector renglón 5 por la columna y, ¿qué número se obtiene? 


0 
x "Ay = [0 Uk ; s 11 = 
0 


veces la columna y = (0, 1, 0). 


b) Este es el renglón YA = 
c) Este es el renglón x* = [0 1] veces la columna Ay = 








54. Cuando se traspone una matriz en bloque M = [£ $], el resultado es M” = / 
Pruébelo. ¿Qué condiciones deben imponerse a A, B, C, D para que la matriz en bloque 
sea simétrica? 

55. Explique por qué el producto interno de x y y es igual al producto interno de Px y Py. 
Luego, (PxY (Py) = x*y, indica que PYP = ] para cualquier permutación. Con x = (1, 
2,3) y y = (1, 4, 2), escoja P para demostrar que (Px)*y no es siempre igual a (PYy). 


Los problemas 56 a 60 son sobre matrices simétricas, y sus factorizaciones. 


56. SIA =A* y B =B', ¿cuáles de las siguientes matrices son ciertamente simétricas? 
DA-B  bB(AF+BMA-B) Cc)ABA  d)ABAB 

57. Si A = A? requiere un intercambio de renglones, entonces también necesita un inter- 
cambio de columnas para permanecer simétrica. En lenguaje de matrices, PA pierde la 
simetría de A pero recupera la simetría. 

58. a) ¿Cuántos elementos de A pueden elegirse independientemente, si A = A” es de 5 

por 5? 
b) ¿De qué manera pueden L y D (de 3 por 5) proporcionar el mismo número de op- 
ciones en LDL*? 

59. Suponga que R es rectangular (de m por n) y que A es simétrica (de m por m). 
a) Trasponga RAR para mostrar su simetría. ¿De qué forma es esta matriz? 
b) Demuestre por qué RTR no contiene números negativos en su diagonal. 


60. Factorice las siguientes matrices en A = LDL*. La matriz D es diagonal: 


ES E 
1 lb 
a=| | y a=| | y A=|i 2 -1l 
E aña Nel 2 


Los tres siguientes problemas son sobre aplicaciones de (40) y = x“(4*y). 


61. Las ciudades de Boston, Chicago y Seattle están conectadas con cables que conducen 
energía eléctrica. Los voltajes que reciben estas ciudades son xp, Xc, xs. Con resisten- 
cias unitarias entre las ciudades, las tres corrientes están en y: 


Yac o A E 
Y =AxX €sS ys | =|0 1-1] ]xel. 
YBS 1 oO —i XS 


a) Encuentre las corrientes totales A*y de las tres ciudades. 
b) Compruebe que (4x)*y coincide con x*(4*y): hay seis términos en cada una. 


62. La producción de x, camiones y x, aviones requiere x, + 50x, toneladas de acero, 
40x, + 1000x, libras de caucho, y 2x, + 50xz meses de trabajo. Si los costos unita- 


58 Capítulo 1 Matrices y eliminación gaussiana 


rios y;» y2, y3 son $700 por tonelada, $3 por libra, y $3000 por mes, ¿cuáles son los va- 


lores de un camión y un avión? Éstas son las componentes de A*y, 


63. Ax proporciona las cantidades de acero, caucho y trabajo para producir x en el proble- 
ma 62, Encuentre A. Luego (Ax)*y es el de entradas, mientras x(A*y) es el va- 
lor de 





64. A continuación se presenta otra factorización de A en una triangular multiplicada por | 
una simétrica: 
Se empieza con A = LDU. Luego, A es igual a L(U*)”* por UTDU. 3 
¿Por qué es triangular Z(UB)7*? En su diagonal sólo hay 1s. ¿Por qué es simétrica 
USDO? 


65. Un grupo de matrices incluye a AB y A”? si incluye a A y B. “Los productos y las in- 
versas permanecen en grupos.” ¿Cuáles de los siguientes conjuntos son grupos? Las 
matrices triangulares inferiores £ con 1s en su diagonal, las matrices simétricas S, las 
matrices positivas M, las matrices diagonales invertibles D, las matrices de permuta- 
ción P. Invente dos grupos de matrices más. 


ON et 


ENE 


A ESE 


66. Si todo renglón de una matriz de 4 por 4 contiene a los números O, 1, 2, 3 en algún or- 
den, ¿la matriz puede ser simétrica? ¿Puede ser invertible? 


67. Demuestre que ningún reordenamiento de renglones ni de columnas puede trasponer 
una matriz típica. 


h z Eds, sis » 
ISSO AS 


68. Una matriz noroeste cuadrada B es cero en la esquina sureste, abajo de la antidiago- 
nal que une (1, n) con (a, 1). B" y B?, ¿son matrices noroeste? B”!, ¿es noroeste o su- 
reste? ¿Cuál es la forma de BC = noroeste multiplicada por sureste? Se permite com- 
binar permutaciones con las L y U de costumbre (suroeste y noreste). 


69. Compare tic; inv(A); toc para A = rand(500) y A = rand(1000). El conteo n* indica 
que el tiempo de cómputo (medido por tic; toc) debe multiplicarse por 8 cuando n se 
duplica. ¿Cree el lector que esta A aleatoria es invertible? 


70. 7 = eye(1000); A = rand(1000); B = triu(A); produce una matriz triangular aleatoria 
B. Compare los tiempos para invíB) y BW. La diagonal al revés se somete a ingenie- 
ría con la finalidad de utilizar los ceros en B, mientras inv utiliza los ceros en / cuan- 
do [B 1] se reduce por Gauss-Jordan. (También compare con inv(4) y AVÍ para toda la 
matriz A.) 


71. Demuestre que L7? tiene elementos j/i para i = ¡ (la matriz —1, 2, —1 tiene esta 1): 


100 3 9 E O, ESTOS 
1 ñ 
O A 
2 eZ : 
ec E O E. 
0 0-3 1 2.5 3 1 
Pruebe este patrón para L = eye(5) — diag(1:5) “diag(1:4,—1) e inv(L). 








1.7 MATRICES ESPECIALES Y APLICACIONES 


Esta sección tiene dos objetivos. El primero consiste en explicar una forma en la que grandes 
sistemas lineales Ax = b pueden presentarse en la práctica. La verdad es que un problema 
grande y realista en ingentería o economía nos llevaría demasiado lejos del alcance de este li- 
bro, aunque hay una aplicación natural e importante que no requiere mucha preparación. 
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El otro objetivo consiste en ilustrar, aprovechando la misma aplicación, las propieda- 
des especiales que suelen tener las matrices de coeficientes. Las matrices grandes siempre 
presentan un patrón definido; a menudo un patrón de simetría, y muchísimos elementos 
iguales a cero. Debido a que una matriz “holgada” contiene mucho menos de n” piezas de 
información, los cálculos deben ser rápidos. Se abordarán las matrices banda, con la fina- 
lidad de ver cómo la concentración cerca de la diagonal acelera la eliminación. De hecho, 
se analiza una matriz tridiagonal especial. 

La matriz misma puede verse en la ecuación (6). Proviene del intercambio de una 
ecuación diferencial con una ecuación matricial. El problema continuo pide por u(x) en ca- 
da x, por lo que una computadora no es capaz de resolverlo exactamente. Debe ser aproxi- 
mado por un problema discreto: mientras más incógnitas se tienen, mejor es la precisión y 
mayor el gasto. Como un problema continuo sencillo aunque también bastante típico, nues- 
tra elección se dirige a la ecuación diferencial 

a 
3 = 46, OS ts E (1 

Esta es una ecuación lineal para la función incógnita u(x). Cualquier combinación 
C + Dx puede sumarse a cualquier solución, ya que la segunda derivada de € + Dx no 
contribuye con nada. La incertidumbre que dejan estas dos constantes arbitrarias C y D se 
elimina mediante una “condición a la frontera” en cada extremo del intervalo: 


u(0) =0, u(1) =0, (2) 


El resultado es un problema de dos puntos con valor en la frontera, que describe un fenó- 
meno que no es transitorio, sino de estado estacionario; por ejemplo, la distribución de tem- 
peratura en una varilla cuyos extremos están fijos a 0%, y con una fuente de calor Ax). 

Recuerde que nuestro objetivo es producir un problema discreto; en otras palabras, un 
problema en álgebra lineal. Es por ello que sólo es posible aceptar una cantidad finita de in- 
formación sobre Ax), por ejemplo, sus valores en n puntos equidistantes x = h, x = 2h,..., 
x = nh, Para la solución verdadera u se calculan valores aproximados uy, .. . , Ut, en esos 
mismos puntos. En los extremos x = 0 y x= 1 = (n + 1DX, los valores en la frontera son 
Uy = 0 Y Un+i = 0, 

La primera pregunta es: ¿Cómo se sustituye la derivada d*u/dx?? La primera deriva- 
da puede ser aproximada deteniendo Au/Ax en un tamaño de paso finito, y no permitiendo 
que A (o Ax) tienda a cero. La diferencia Au puede ser hacia adelante, hacia atrás, O cen- 
trada: 


Au Es uh) = 40) IAS uy ut == h) pia SA = (A 0) 


3 
Ax h h 2h 6) 
La última expresión es simétrica respecto a x, y es la más precisa. Para la segunda deriva- 
da hay justo una combinación que sólo utiliza los valores de x y x + h: 
deu Atu  u(x+h)-2u(x) + u(x —h) 
Segunda diferencia  ——= — =  ___z-_=-, 4 
sá di” Ax 2 dl 
Lo anterior también tiene el mérito de ser simétrico con respecto a x. Para repetir, el miem- 
bro derecho tiende al valor verdadero de d*u/dx? cuando h => 0, aunque es necesario de- 
tenerse en una A positiva. 
En cada punto de la malla, x = ¡h, la ecuación —d*u/dx? = fx) se sustituye por su 
análogo discreto (5). Se multiplicó por h* para alcanzar n ecuaciones Au = b: 


Ecuación en diferencias — —u;,,¡ +24; -=uj =h*f(jh) para ¡=1,...,n. 6) 


Las ecuaciones primera y última (| = 1 y j = n) incluyen uy = 0 y UU, , = O, que se cono- 
cen a partir de las condiciones a la frontera. Estos valores deben desplazarse al miembro 
derecho de la ecuación si se desea que sean distintos de cero. La estructura de estas n ecua- 


PIAIDILAIARÁ 


00 
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ciones (3) puede visualizarse mejor en forma matricial. Se escoge h = : para obtener una 
matriz A de 5 por 5: 


2 Al uy F(h) 
on 149 F(2h) 
Ecuación matricial 1. 2 -1 ui =hk1fG6N 1. (6) 
E f(4h) 
O AE f(Sh) 


A partir de este momento se trabajará con la ecuación (6). Tiene una matriz de coeficien- 
tes bastante regular, cuyo orden n puede ser muy grande. La matriz A tiene muchas propie- 
dades especiales, de las cuales tres son fundamentales: 


1. La matriz A es tridiagonal. Todos los elementos diferentes de cero están en la diago- 
nal principal y en las dos diagonales adyacentes. Fuera de esta banda todos los ele- 
mentos son a = O. Estos ceros traerán una simplificación considerable para la elimi- 
nación gaussiana. 

2. La matriz es simétrica. Cada elemento a, es igual a su imagen especular ay; de modo 
que A* = A. La triangular superior U es la traspuesta de la triangular inferior £, y 
A = LDL'. Esta simetría de A refleja la simetría de d42u/dx?. Una derivada impar co- 
mo du/ldx o 'uldx? destruiría la simetría. 

3. La matriz es positiva definida. Esta propiedad adicional indica que los pivotes son po- 
sitivos. Los intercambios de renglones son innecesarios en la teoría y en la práctica. 
Esto contrasta con la matriz B, al final de esta sección, que no es positiva definida. Sin 
ningún intercambio de renglones, es totalmente vulnerable al redondeo. 

La característica de positiva definida reúne todo este curso (¡en el capítulo 6!) 


Ahora se vuelve al hecho de que A es tridiagonal. ¿Cuál es el efecto de esto en la eli- 


minación? La primera etapa del proceso de eliminación produce ceros abajo del primer 
pivote: 


al 2 1 
A ll 0 3 -1 
Eliminación 2 2 1 ms 24 2 —] 
en A: Paso 1 E de 2 —1 
| 2 > Z 


En comparación con una matriz general de 5 por 5, este paso presenta dos simplificaciones 
importantes: 


1. Abajo del pivote sólo hay un elemento diferente de cero. 
2. El renglón del pivote es muy corto. 


El multiplicador f,, = =3 proviene de una división. El nuevo pivote, 2, proviene de una 
simple multiplicación-Sustracción. Además, se preserva el patrón tridiagonal: Toda etapa 
de la eliminación acepta las simplificaciones a) y b). 
El resultado final es la factorización LDU = LDL* de A. ¡Observe los pivotes! 
E 
1 a 
3 ] 
ao sa 
3 
1 2 4 
a 1 A $ a 
5 5 1 


ai 
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Los factores L y U de una matriz tridiagonal son bidiagonales. Los tres factores juntos tie- 
nen la misma estructura de banda de tres diagonales esenciales (3n — 2 parámetros) que A. 
También observe que £L y U son traspuestas entre sí, como era de esperar por la simetría. 
Todos los pivotes 2/1, 3/2, 4/3, 5/4, 6/5 son positivos. Su producto es el determinante de 
A: det A = 6. Resulta evidente que los pivotes convergen a 1 cuando n se hace grande. Es- 
tas matrices hacen muy felices a las computadoras. 

Estos factores holgados L y U cambian por completo el conteo de operaciones de cos- 
tumbre. La eliminación en cada columna requiere sólo dos operaciones, como arriba, y hay 
n columnas. En vez de las n*/3 operaciones, sólo se necesitan 2n. Los sistemas tridiagona- 
les Ax = b pueden resolverse casi de inmediato. El costo de resolución de un sistema tri- 
diagonal es proporcional a n. 

Una matriz de banda tiene a,, = O excepto en la banda li — ¡| < w (véase la figura 
1.8). El “semiancho de banda” es w = 1 para una matriz diagonal, w = 2 para una matriz 
tridiagonal, y w = n para una matriz completa. Para cada columna, la eliminación requie- 
re w(w -— 1) operaciones: un renglón de longitud w actúa sobre w -— 1 abajo. La elimina- 
ción en las n columnas de una matriz de banda requiere alrededor de w*n operaciones. 





Figura 1.8 Una matriz de banda A y sus factores £ y U. 


Cuando w tiende a n, la matriz se vuelve completa, y el conteo es aproximadamente n?. 
Para un conteo exacto, la esquina inferior del miembro derecho ya no tiene espacio para un 
ancho de banda w. El número preciso de divisiones y multiplicaciones-sustracciones que 
producen L, D, U (sin suponer que A es simétrica) es P = 3 w(w-— 13n-— 2w + 1). Para 
una matriz completa con w = n, se recupera P = 3 n(n — Dn + 1). Este es un número en- 
tero, ya que n— 1, n, y n + 1 son enteros consecutivos, y uno de ellos es divisible entre 3. 

Este es el último conteo de operaciones, y se recalca la cuestión más importante. Una 
matriz de diferencias finitas como A tiene una inversa completa. Al resolver Ax = b, en rea- 
lidad se está en una peor situación si se conoce A” * que si se conocen L y U. La multipli- 
cación de A”? por b requiere n? pasos, mientras para la eliminación hacia adelante y la sus- 
titución hacia atrás que producen x = UT! = UT*L7!bh = A7'b, son suficientes 4n pasos. 

Esperamos que este ejemplo haya reforzado la comprensión que el lector tiene sobre 
la eluninación (¡de la cual ahora suponemos que está perfectamente entendida!) Se trata de 
un ejemplo genuino de los grandes sistemas lineales que en realidad se encuentran en la 
práctica. En el siguiente capítulo la atención se centra en la existencia y unicidad de x, pa- 
ra m ecuaciones en n incógnitas. 


Error por redondeo 


En teoría, el caso no singular se ha completado. Hay un conjunto completo de pivotes (con 
intercambios de renglones). En la práctica, más intercambios de renglones pueden ser 
igualmente necesarios, o bien, la solución calculada puede convertirse fácilmente en inútil. 





Capítulo 1 


Matrices y eliminación gaussiana 


Dedicaremos dos páginas (completamente opcionales en clase) para hacer más estable la 
eliminación: por qué es necesaria y cómo se lleva a cabo. 

Para un sistema de tamaño moderado, por ejemplo de 100 por 100, la eliminación im- 
plica alrededor de 330 000 operaciones (3 n2). Con cada operación es necesario esperar un 
error por redondeo. Normalmente, se mantiene fijo un número de dígitos significativos (por 
ejemplo tres para una computadora extremadamente débil). Así, la adición de dos números 
de tamaños diferentes proporciona un error: 


Error por redondeo 0.456 + 0.00123 => 0.457 pierde los dígitos 2 y 3. 


¿Cómo contribuyen todos estos errores individuales al error final en Ax = b? 

Este problema no es fácil. Fue atacado por John von Neumann, quien era el matemá- 
tico más reputado en la época en que las computadoras repentinamente hacían posible un 
millón de operaciones. De hecho, la combinación de Gauss y Von Neumann proporciona 
al simple algoritmo de eliminación una historia extraordinariamente distinguida, aunque 
incluso Von Neumann sobreestimó el error por redondeo final. Quien encontró la forma co- 
rrecta para contestar la pregunta fue Wilkinson, cuyos libros se han convertido en clásicos. 

Dos ejemplos sencillos ilustrarán tres cuestiones importantes sobre el error por redon- 
deo. Los ejemplo son 


l. 1. 


> ".0004 


Mal acondicionado A = 1 Ll 


| Bien acondicionado B = dci $ 


Á es casi singular, mientras B está lejos de ser singular. Si el último elemento de A se mo- 
difica ligeramente a a, = 1, entonces Á es singular. Considere dos miembros derechos 
bastante parecidos: 


u + v=2 u + v=24 
u + 1.000lv =2 y u + 1.0001v = 2.0001 


La solución del primero es u = 2, v = O. La solución del segundo es u = v = 1. Un cam- 

bio en el quinto dígito de b fue amplificado a un cambio en el primer dígito de la solución. 

Ningún método numérico es capaz de evitar esta sensibilidad a pequeñas perturbaciones. 

El mal acondicionamiento puede desplazarse de un lado a otro, pero no es posible eliminar- 

lo. La verdadera solución es muy sensible, y la solución calculada no puede dejar de serlo. 
El o nl es como sigue. 


CO A ARO A TEA IR o 
El net si Eds Lal e e a a 


10 Incluso. úna mátriz ¿bién acondicionada o como B puede ser arruinada por un al eS 
 goritmo. deficiente, RES a A 








AS] 


Lamentamos decir que para la matriz B, la eliminación gaussiana directa es un algoritmo 
deficiente. Suponga que .0001 es aceptado como el primer pivote. Luego, 10 000 veces el 
primer renglón se resta del segundo. El elemento inferior derecho se convierte en --9999, 
pero el redondeo hasta tres cifras proporcionaría —10 000. Cualquier traza del elemento 1 
desaparecería: 


Eliminación en B con 0.000lu +v = 1 E 0.000lu4 +v =1 
un pivote pequeño u+v=2 —9909v = —90908. 
El redondeo produce —10 000y = —10 000, o bien u = 1. Esto es correcto hasta tres cifras 


decimales. La sustitución hacia atrás con el uv = .9999 correcto proporciona u = 1: 
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Resultado correcto  0.000l1lu + 0.9999 = 1, 0 bien, u = 1. 


En vez de lo anterior, al aceptar v = 1, que es erróneo sólo en la cuarta cifra decimal, se 
obtiene u = 0: 


Resultado erróneo  0.000lu + 1 = 1, o bien, u = 0. 


La u calculada es completamente errónea. B está bien acondicionada pero la eliminación 
es violentamente inestable. £, D, y U están completamente fuera de escala con B: 


g=[ 1  0]foo001 o 7Tf1 10000 
10000 1 oO  -—999 lo 1 | 


El pequeño pivote 0.0001 trajo insensibilidad, y el remedio es evidente: intercambiar 
renglones. 





Wu E da DE de piñas IS A ES E Ny NN y E 
3 AREA, ES SE ES eS o E E Ses E de cae. ” ol NE 


ar 


Para B, el pivote 0.0001 podría compararse con el pivote posible 1 que está abajo de él. Un 
intercambio de renglones tendría lugar de inmediato. En términos matriciales, esta es una 
multiplicación por una matriz de permutación P = [7 1]. La nueva matriz C = PB tie- 
ne buenos factores: 


A E Y E O E 
0.0001 1] — |o.0001 1] |o 0.9999] |o 


Los pivotes para C' son 1 y 0.9999, mucho mejores que 0.0001 y —9999 para B. 

La estrategia del pivoteo completo también busca en todas las últimas columnas el pi- 
vote más grande posible. No sólo podría ser necesario un intercambio de renglones, sino 
también uno de columnas. (Esto es la posmultiplicación, por una matriz de permutación). 
La dificultad al ser tan conservador es el gasto, y el pivoteo parcial es bastante adecuado. 

Finalmente se ha legado al algoritmo fundamental del álgebra lineal numérica: la eli- 
minación con pivoteo parcial. Algunos refinamientos adicionales, como, ver si es nece- 
sario reescalar todo un renglón o toda una columna siguen siendo posibles. Pero esencial- 
mente, el lector sabe ahora lo que hace una computadora con un sistema de ecuaciones 
lineales. En comparación con esta descripción “teórica” —encontrar A7*, y multiplicar 
A7*b— nuestra descripción ha consumido bastante del tiempo (y paciencia) del lector. 
Desearía que hubiese una forma mas fácil de explicar cómo x se encuentra realmente, aun- 
que no creo que la haya. 





Conjunto de problemas 1.7 


1. Escriba los factores LDU = LDL? de A en la ecuación (6) cuando n = 4. Encuentre el 
determinante como el producto de los pivotes en PD. 


2. Modifique a,, en la ecuación (6) de a, = 2a a;, = 1, y encuentre los factores LDU 
de esta nueva matriz tridiagonal. 
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3, Encuentre la matriz Ay de 5 por 5 (h = 3) que aproxima 


dy du du 
a “O == =0, 
dx? FG), add a ) 


sustituyendo estas condiciones a la frontera por uy = uy y us = us. Compruebe que E E 
su Ay multiplicada por el vector constante (C, C, €, C, €) produce cero; Ay es sin- 1 
gular. De manera semejante, si u(x) es una solución del problema continuo, enton- 1 | 


ces también lo es u(o) + C, 


. Escriba la ecuación de la matriz de diferencias finitas de 3 por 3 (A = 3 ) para 


2 
e +u=x, u(0) = u(1) =0. 


. Conh= 3 y fo) = 47 sen 27x, la ecuación en diferencias (5) es 


A e AN 
A = + ol. 
01 Z u3 —1 


Resuelva para u,, 47, y y encuentre su error en comparación con la solución verdade- 
rá U = Sen 2TxXe0XxX= ¿,x*" 35,yx= 3. 


. ¿Cuál es el sistema de 5 por 5 que sustituye a (6) si las condiciones en la frontera se 


cambian a u(0) = 1, u(1) = 0? 


Los problemas 7 a 11 son sobre el error por redondeo y los intercambios de renglones. 


7. Calcule H7* en dos formas para la matriz de Hilbert de 3 por 3 


10. 


11. 


1 
H = 


LM nin 
hr (Gujas poi 
Llaja Pla QMUiea 


primero por cálculo exacto y luego redondeando cada número hasta tres cifras. Esta 
matriz H está mal acondicionada y los intercambios de renglones no son de utilidad. 


. Para la misma matriz A, compare los miembros derechos de Hx = b cuando las solu- 


ciones son x = (1, 1, 1) y x = (0, 6, —3.6). 


. Resuelva Hx = b = (1,0,... 0) para la matriz de Hilbert de 10 por 10 con hy = 


1/(i + ¡— 1), usando cualquier código de computadora para ecuaciones lineales. Lue- 
go, intercambie un elemento de b por .0001, y compare las soluciones. 


Compare los pivotes en eliminación directa con los del pivoteo parcial para la siguien- 


te matriz. 
[0.001 0 
ps e 


(En realidad, éste es un ejemplo que requiere reescalamiento antes de la eliminación.) 


Explique por qué el pivoteo parcial produce multiplicadores £,, en L que satisfacen |£,,| 
<= 1. ¿Puede proporcionar un ejemplo de 3 por 3 con todos los la,| <= 1 cuyo último 
pivote sea 47 Este es el peor de los casos, ya que cada elemento es cuando mucho mul- 
tiplicado por 2 cuando |£ | < 1. 








| 
| 
| 
| 
| 
| 
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Ejercicios de repaso 


14 


1.2 


1.3 


1.4 


1S 
1.6 


2 
1.8 


1.9 
1.10 


1.11 


1.12 


a) Escriba las matrices de 3 por 3 con elementos 


| 


| y bi = 


b) Calcule los productos AB, BA y A?. 
Para las matrices 


NO 2 
by » »-bi 


calcule AB y BAyA7* y B"? y (AB)!. 
Encuentre ejemplos de matrices de 2 por 2 con a, = 5 para las cuales 


0.2 =L, By ATREA Cc) A?=A. 


Resuelva por eliminación y sustitución hacia atrás. 


Y) +w=4 v+w=0 
uc + Y =3 y Y) +w=0 
Uu+tuU+w=6 4 +v = 6. 


Factorice las matrices precedentes en A = LU o bien PA = LU. 


a) Hay 16 matrices de 2 por 2 cuyos elementos son 1s y Os. ¿Cuántas son invertibles? 


b) (¡Mucho más difícil!) Si al azar se escriben 1s y Os en los elementos de una ma- 
triz de 10 por 10, ¿qué es más probable: que la matriz sea invertible o que sea 
singular? 


Hay 16 matrices de 2 por 2 cuyos elementos son 1s y —1s. ¿Cuántas son invertibles? 


¿Cómo están relacionados los renglones de EA con los renglones de A en los casos 
siguientes? 


1.00 A O : 
E=J0 2 0 o bien, E = |, 0 o| o bien, E = Dd 0 
E E A E 05,50 


Escriba un sistema de 2 por 2 que tenga una infinidad de soluciones. 


Encuentre inversas, si existen, por inspección o por eliminación de Gauss-Jordan: 


OS 3 l1o1—2 
A=|1 1 0 y A=|1 2 1 y A=l 1 -2  1Í. 
a ES | 00 a 0 


Si E es de 2 por 2 y suma la primera ecuación a la segunda, ¿cuáles son las matrices 
E? y E8 y 8E? 
¿Falso o verdadero? Proporcione una explicación si es verdadero y un contraejem- 
plo si es falso: 


1) Si A es invertible y sus renglones aparecen en orden invertido en B, entonces B 
es invertible. 
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2) Si A y B son simétricas, entonces AB es simétrica. 
3) Si A y B son invertibles, entonces BA es invertible. 


4) Toda matriz no singular puede factorizarse en el producto Á = LU de una trian- 
gular inferior £ y una triangular superior U. 





1.13 Resuelva Ax = b resolviendo los sistemas triangulares Lc = b y Ux = c: 


Ea od 0 
A=L5U=|l4 1 ollo 1 3|, ¿=|]0l. 
A odo 1 


¿Qué parte de A”* encontró con esa b particular? 


a iS 


1.14 De ser posible, encuentre matrices B de 3 por 3 tales que 
a) BA = 2A para toda A. 
bj) BA = 2B para toda A, 
c) BA tenga los renglones primero y último de A, invertidos. 
d) BA tenga las columnas primera y última de A, invertidas. 





RL AU A A 


po 
1.15 Encuentre el valor de c en la siguiente inversa de n por n. 
n -1 +. —1 coa 1 
E ql —] n . —] 1 A 7 Í 
si Á . —1| thtonces Á A a 
1-1 -1 o n E ES =p 
1.16 ¿Para qué valores de k el sistema A 
kx + y=1 
x+ky=1 
no tiene solución, tiene una, solución, o bien tiene una infinidad de soluciones? 
1.17 Encuentre la factorización simétrica A = LDL? de 
¡E 6 
b 
A=/|2 6 4 y A = a a 
O 4 11 
1.18 Suponga que Á es la matriz identidad de 4 por 4, excepto por un vector v en la co- 
humna 2: 
04 07:0 
A. 0 UY) 0 0 
e e O E 
0 Va O 1 


a) Factorice A en LU, suponiendo uz 7 O. 


b) Encuentre A”7*, que tiene la misma forma que A. 








1,19 Resuelva por eliminación, o demuestre que no hay solución: 


u+t v+ w=0 y+F y+ w=0 
u + 2v +3w=0 y u+ v+3w=0 
du + 5v + Vw =1 Bu + 5v + Tw = 1. 


1.20 Las matrices de permutación de n por n constituyen un ejemplo importante de un 
“grupo”. Si se multiplican, se sigue permaneciendo dentro del grupo: tienen inversas 








1.21 
1.22 


1.23 


1.24 


1.25 


1.26 


1.27 


1.28 
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en el grupo, la identidad está en el grupo; y la ley P,(P2P3) = (P,P>)P; es verdade- 

ra, ya que es verdadera para todas las matrices. 

a) ¿Cuántos miembros pertenecen a los grupos de las matrices de permutación de 4 
por 4 y de n por n? 

b) Encuentre una potencia k de modo que todas las matrices de permutación de 3 
por 3 cumplan Pf = ], 


Describa los renglones de DA y las columnas de AD si D = le aj: 
a) SiA es invertible, ¿cuál es la inversa de A*? 
b) Si A también es simétrica, ¿cuál es la traspuesta de A7*? 


c) Hlustre ambas fórmulas cuando A = [f 7]. 


Experimente con n = 2 y n = 3, para encontrar 


e A y IA E 0 

a O ES A: E 1% 
Empiece con un primer plano u + 2v — w = 6, para encontrar la ecuación de lo si- 
guiente: 
a) El plano paralelo que pasa por el origen. 


b) Un segundo plano que también contenga los puntos (6, O, 0) y (2, 2, 0). 
c) Un tercer plano que se corte con los planos primero y segundo en el punto (4, 1, 0). 


¿Qué múltiplo del renglón 2 se resta del renglón 3 en la eliminación hacia adelante 
de A? 
y Sa E A O: 
Aziz do O 0 O. 
005 da 10-20 4 
¿Córno sabe el lector (sin multiplicar estos factores) que Á es invertible, simétrica, y 
tridiagonal? ¿Cuáles son los pivotes? 


a) ¿Cuál es el vector x que hace Áx = columna 1 de A + 2(columna 3), para una 
matriz A de 3 por 3? 


b) Obtenga una matriz que cumpla columna 1 + 2(columna 3) = 0. Compruebe que 
A es singular (menos de 3 pivotes), y explique por qué, éste debe ser el caso. 


¿Falso o verdadero? Proporcione un contraejemplo si es falso, y una explicación sl 

es verdadero: 

1) SiL,U, = £,U; (las matrices U son triangulares superiores con diagonal diferen- 
te de cero, y las matrices £ son triangulares inferiores con diagonal de 1s), enton- 
ces L, = E; y U, = U;. La factorización LU, es única. 

2) SiA? +A =/ entonces AT! =A +71 

3) Si todos los elementos en la diagonal de A son cero, entonces Á es singular. 


Al tanteo o con la eliminación de Gauss-Jordan calcule 


=1 =1 


E 300.0" AO 0 40 
O: EE 3 £ 1 0 ; ES E 3 
m O 1 m O 1 O m 1 
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1.29 Escriba las matrices de 2 por 2, tales que 
a) Invierten la dirección de cada vector. 
bj) Proyectan cada vector sobre el eje x,. 
c) Hacen girar 90? a cada vector en sentido contrario al sentido de movimiento de 
las manecillas del reloj. 
d) Reflejan cada vector a 45” respecto a la recta x, = x». 


MO ON 


A eii 
A TS 


Ni rea 
PON 


AA NTE 
La E A A 
d 6 


dei 


Ec 











Capítulo 





Espacios vectorrales 





2.1 ESPACIOS Y SUBESPACIOS VECTORIALES 


La eliminación puede simplificar, elemento por elemento, el sistema lineal Ax = b. Por for- 
tuna, también simplifica la teoría. Las preguntas básicas de existencia y unicidad: ¿existe 
una solución?, ¿no existe ninguna solución?, o bien, ¿existe una infinidad de soluciones? 
Todas estas preguntas podrán responderse más fácilmente después de aplicar la elimina- 
ción. Para tratar estas interrogantes se requiere una sección más, con la finalidad de encon- 
trar todas las soluciones para un sistema de m por n. Así el ciclo de ideas estará completo. 

Sin embargo, la eliminación sólo produce un tipo de entendimiento sobre Ax = b. 
Nuestro objetivo principal es lograr una comprensión distinta y más profunda. Se trata del 
corazón del álgebra lineal. 

Para la noción de espacio vectorial, de inmediato se empieza con los espacios más im- 
portantes, que se denotan por R?, R?, R3,...; el espacio R” consta de todos los vectores co- 
lumna con n componentes. (Se escribe R porque los componentes son números reales). R? se 
representa por el plano x-y de costumbre; las dos componentes del vector se convierten en las 
coordenadas x y y del punto correspondiente. Las tres componentes de un vector en R? pro- 
porcionan un punto en el espacio tridimensional. El espacio unidimensional R! es una recta. 

Lo importante para el álgebra lineal es que la extensión a n dimensiones es directa. Pa- 
ra un vector en R* sólo se requieren siete componentes, incluso si es difícil visualizar la 
geometría. En todos los espacios vectoriales son posibles dos operaciones: 





Es posible sumar dos vectores cualesquiera, y todos los vectores pueden multipli- 
carse por escalares. 
En otras palabras, puede trabajarse con combinaciones lineales. 






La suma obedece la ley conmutativa x + y = y + x; existe un “vector cero” que cumple 
O + x= x; y hay un vector “—x” que satisface —x + x = O, Ocho propiedades (incluyen- 
do las tres anteriores) son fundamentales: la lista completa se proporciona en el problema 
5 al final de esta sección. Un espacio vectorial real es un conjunto de vectores junto con 
reglas para la suma vectorial y la multiplicación por números reales. La suma y la mul- 
tiplicación deben producir vectores en el espacio, y deben cumplir las ocho condiciones. 
Normalmente, estos ocho vectores pertenecen a uno de los espacios R”; son vectores 
columna normales. Six = (1, O, 0, 3), entonces las componentes de 2x (y también de x + x) 
son 2, O, 0, 6. La definición formal permite que otros entes sean “vectores”, en el supuesto 
de que la adición y la multiplicación por escalares estén bien. Se proporcionan tres ejemplos: 


UN 


es 
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Ejemplo 1 


1. El espacio dimensional infinito KR”. Sus vectores tienen una infinidad de componen- 
tes, como en x = (1, 2, 1,2,...). Las leyes para x + y y cx permanecen sin cambio. 

2. El espacio de las matrices de 3 por 2. ¡En este caso los “vectores” son matrices! Es 
posible sumar dos matrices, y A + B = B + A; existe una matriz cero, etc. Este espa- 
cio es casi el mismo que R*. (Las seis componentes están dispuestas en un rectángu- 
lo, en vez de en una columna.) Cualquier elección de m y n proporcionaría, como 
ejemplo semejante, el espacio vectorial de todas las matrices de m por n. 

3. El espacio de las funciones f(x). Aquí se admiten todas las funciones f que están de- 
finidas en un intervalo fijo, por ejemplo O <= x <= 1. El espacio incluye a f(0) = 4, 
2(%) = sen x, su suma (F + 2g)G0) = 2 + sen x, y todos los múltiplos como 3x1 y —sen 
x. Los vectores son funciones, y la dimensión es de alguna manera un infinito más 
grande que para R*”. 


En los ejercicios se proporcionan otros ejemplos, pero los espacios vectoriales que más 
requerimos, están en otra parte: se encuentran dentro de los espacios estándares R". De- 
seamos describirlos y explicar por qué son importantes. Geométricamente, piense en el es- 
pacio tridimensional de costumbre R* y elija cualquier plano que pase por el origen. Ese 
plano es un espacio vectorial por derecho propio. Si un vector en el plano se multiplica por 
3,0 por —3, se obtiene un vector en el mismo plano. Si se suman dos vectores en el plano, 
su suma permanece en el plano. Este plano que pasa por (0, O, 0) ilustra uno de los concep- 
tos más importantes en el álgebra lineal; se trata de un subespacio del espacio original R?. 





DEFINICIÓN Un subespacio de un espacio vectorial es un conjunto no vacío que satisfa- 
ce los requisitos de un espacio vectorial: las combinaciones lineales permanecen en el 
subespacio. 


i) Si se suman dos vectores cualesquiera en el subespacio, x.+ y está en el subespacio. 


.. 


11) Si cualquier vector x en el subespacio se multiplica por cualquier escalar c, cx está en 
el subespacio. 


Observe cómo se recalca la palabra espacio. Un subespacio es un subconjunto “cerra- 
do” bajo la suma y la multiplicación por un escalar. Estas operaciones cumplen las reglas 
del espacio huésped, ya que se sigue estando dentro del subespacio. Las ocho propieda- 
des requeridas siguen cumpliéndose en el espacio más grande, por lo que se cumplen au- 
tomáticamente en todo subespacio. Observe en particular que el vector cero pertenece a 
todo subespacio. Este hecho se debe a la regla 11): el escalar se escoge como c = 0. 


El subespacio más pequeño Z contiene sólo un vector: el vector cero. Se trata de un 
“espacio con dimensión cero”, que sólo contiene el punto en el origen. Las reglas 1) y 11) se 
cumplen, ya que la suma O + O está en este espacio con un punto, así como todos los mul- 
tiplicadores cO. Este es el espacio vectorial más pequeño posible: el espacio vacío no está 
permitido. En el otro extremo, el subespacio más grande es todo el espacio original. Si el 
espacio original es R”, entonces es fácil describir los subespacios posibles: R? mismo, cual- 
quier plano que pase por el origen, cualquier recta que pase por el origen, o sólo el origen 
(el vector cero). 

La diferencia entre un subconjunto y un subespacio se aclarará mediante ejemplos. En 
cada caso, ¿es posible sumar vectores, y multiplicar por escalares sin salir dei espacio? 


Considere todos los vectores en R* cuyas componentes son positivas o cero. Este subcon- 
junto es el primer cuadrante del plano x-y; las coordenadas satisfacen x => O y y => 0. No es 
un subespacio, aunque contiene al cero, y la adición permanece dentro del subconjunto. Se 
viola la regla 11), ya que si el escalar es —1 y el vector es [1 1], entonces el múltiplo 
cx = [—1 —1] está en el tercer cuadrante, no en el primero. 











Ejemplo 2 
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Si se incluye el tercer cuadrante junto con el primero, la multiplicación por un escalar 
está bien. Todo múltiplo cx permanece en este subconjunto. No obstante, ahora se viola la 
regla 1), ya que al sumar [1 2] + [—2 —1] se obtiene [—1 1], que no está en ninguno de los 
cuadrantes mencionados. El menor subespacio que contiene al primer cuadrante es todo el 
espacio R?. 


Empiece por considerar el espacio vectorial de todas las matrices de 3 por 3. Un subespa- 
cio posible es el conjunto de las matrices triangulares inferiores. Otro es el conjunto de las 
matrices simétricas. A + B y cA son triangulares inferiores si A y B son triangulares infe- 
riores, y son simétricas sí A y B son simétricas. Por supuesto, la matriz cero, está en ambos 
subespacios. 


El espacio columna de A 


A continuación se proporcionan los ejemplos clave: el espacio columna y el espacio nu- 
lo de una matriz A. El espacio columna contiene a todas las combinaciones lineales de 
las columnas de A. Es un subespacio de R”. Se ilustra con un sistema de m = 3 ecuacio- 
nes en n = 2 incógnitas: 


50 by 
La combinación de las columnas es igual a b Se E el = bl. (0 
2 4 b3 


Con m > y se tienen más ecuaciones que incógnitas; en cuyo caso normalmente no hay so- 
lución. El sistema sólo es resoluble para un subconjunto muy “delgado” de todas las bs po- 
sibles. Una forma para describir este subconjunto delgado, es tan simple que es fácil 
ignorarla. 


24: -El sistema Ax = -b.es resoluble< si y sólo: si. el vector bh puede expresarse como. has 





A Una combinación de las columnas de. Ax Por tanto, bd está en el ¿espacio columna. . 


Esta descripción sólo implica un replanteamiento de Ax = b por columnas: 


1 0 by 
Combinación de columnas u |3| +v 14] = |b2|. (2) 
2 4 by 


Estas son las mismas tres ecuaciones en dos incógnitas. Ahora el problema es: encontrar nú- 
meros u y y que multiplican a las columnas primera y segunda para producir b, El sistema es 
resoluble exactamente cuando estos coeficientes existen, y el vector (u, v) es la solución x. 

Se está afirmando que los miembros derechos obtenibles b son todas las combinaciones 
de las columnas de A. Un miembro derecho posible es la columna en sí; los pesos son u = 1 
y vu = O. Otra posibilidad es la segunda columna: u = O y v = 1. Otra tercera posibilidad es 
el miembro derecho b = 0. Con u = 0 y uv = 0, el vector b = O siempre puede obtenerse. 

Es posible describir todas las combinaciones de las dos columnas geométricamente; 
Ax = b puede resolverse si y sólo si b está en el plano generado por los dos vectores co- 
lumna (véase la figura 2.1). Este es el conjunto delgado de bs obtenibles. Si b está fuera del 
plano, entonces no es una combinación de las dos columnas. En ese caso Ax = b no tiene 
solución. 

Lo importante es que este plano no sólo es un subconjunto de R?; es un subespacio. 
Se trata del espacio columna de A, que consta de todas las combinaciones lineales de las 
columnas. Se denota por C(A4). Es fácil comprobar los requerimientos 1) y ii) para un subes- 
pacio de R”: 


A a a 


— e SAS Ñ 
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perpendicular 
al plano 







El 
columna 1=|5 
2 







espacio columna 


Figura 2.1 El espacio columna C(A), un plano en el espacio tridimensional. 


i) Suponga que b y b' están en el espacio columna, de modo que Ax = b para alguna x 
y Ax' = b' para alguna x”. Luego, A(x + x') = b + b', de modo que b + b' también 
es una combinación de las columnas. El espacio columna de todos los vectores obte- 
nibles h es cerrado bajo la suma. 

1i) Si b está en el espacio columna C(4), también lo está cualquier múltiplo cb. Si algu- 
na combinación de columnas produce hb (por ejemplo Ax = b), entonces al multiplicar 
esa combinación por c produce cb. En otras palabras, A(cx) = cb. 


Para Otra matriz A, las dimensiones de la figura 2.1 pueden ser muy distintas. El espa- 
cio columna más pequeño posible (con sólo un vector) proviene de la matriz cero A = O, 
La única combinación de las columnas es b = 0. En el otro extremo, suponga que A es la 
matriz identidad de 5 por 5. Entonces C(1) es todo R3; las cinco columnas de / pueden com- 
binarse para producir cualquier vector pentadimensional b. Esto no es en absoluto especial 
de la matriz identidad. Cualquier matriz de $ por 5 que sea no singular tiene como espa- 
cio columna todo RÍ, Para una matriz así, Ax = hb puede resolverse por eliminación gaus- 
siana; hay cinco pivotes. En consecuencia, todo b está en C(4) para una matriz no singular. 

Ahora puede darse cuenta de cómo el capítulo 1 está contenido en este capítulo. En 
aquél se estudiaron matrices de 1 por n cuyo espacio columna es R”. Ahora se permiten 
matrices singulares, y matrices rectangulares de cualquier forma. Así, C(4) puede estar en 
alguna parte entre el espacio cero y todo el espacio R””. Junto con este espacio perpendicu- 
lar, constituye uno de nuestros dos métodos para comprender Ax = b. 


El espacio nulo de A 


El segundo método para tratar Ax = b es “dual” al primero. No sólo se tiene interés en 
los miembros derechos obtenibles b, sino también en las soluciones x que los obtienen. 
El miembro derecho b = O siempre permite la solución x = 0, aunque puede haber una 
infinidad de otras soluciones. (Siempre hay, en caso de que haya más incógnitas que 
ecuaciones, n > m). Las soluciones de Ax = 0 constituyen un espacio vectorial: el es- 
pacio nulo de A. 
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Se cumple el requerimiento 1): Si Ax = 0 y Ax' = O, entonces A(x + x') = O. El requeri- 
múento 11) también se cumple: Si Ax = O entonces A(cx) = O. ¡Ambos requerimientos fa- 
llan si el miembro derecho no es cero! Sólo las soluciones de una ecuación homogénea 
(b = 0) constituyen un subespacio. Es fácil encontrar el espacio nulo para el ejemplo que 
acaba de proporcionarse; es lo más pequeño posible: 


10 0 
545] - [01 
ALS 0 


La primera ecuación proporciona u = O, y entonces la segunda ecuación obliga a que v = 
O. El espacio nulo sólo contiene al vector (0, 0). Esta matriz tiene “columnas independien- 
tes”, un concepto clave que se presentará en breve. 

La situación cambia cuando una tercera columna es una combinación de las dos pri- 
meras: 


¡A 1 | 
Espacio nulo más grande  B=|S 4 09l. 
2.4 6 


B tiene el mismo espacio columna que A. La nueva columna está en el plano de la figura 
2.1; es la suma de los dos vectores columna con los que se empezó. Sin embargo, el espa- 
cio nulo de B contiene al vector (1, 1, —1), por lo que automáticamente contiene a cual- 
quier múltiplo (c, c, —c): 
y y | E 0 
El espacio nulo es una recta 5 4 9 cl = |Ol. 
2. 4561 1=€ 0 


El espacio nulo de B es la recta que contiene a todos los puntos x = c, y =C,z = —c. (La 
recta pasa por el origen, como debe hacer cualquier subespacio). Lo que se desea es poder 
encontrar, para cualquier sistema Ax = b, y encontrar C(4) y N(A4): todos los miembros de- 
rechos obtenibles b, y todas las soluciones de Ax = 0. 

Los vectores b, están en el espacio columna y los vectores x están en el espacio nulo. 
Se calcularán las dimensiones de estos espacios, y un conjunto idóneo de vectores para ge- 
nerarlos. Esperamos terminar comprendiendo todos los cuatro subespacios que están estre- 
chamente relacionados entre sí y con A: el espacio columna de A, el espacio nulo de A, y 
sus dos espacios perpendiculares. 





Conjunto de problemas 2.1 


1. Construya un subconjunto del plano x-y R? que sea 


a) cerrado bajo la suma y resta, pero no bajo la multiplicación por un escalar. 
b) cerrado bajo la multiplicación por un escalar, pero no bajo la suma vectorial. 
Sugerencia: Empiece con u y vu; sume y reste para el inciso a). Intente cu y cv para el 
inciso bh). 

2. ¿Cuáles de los siguientes subconjuntos de R? son realmente subespacios? 
a) El plano de vectores (b,, b,, b3) cuya primera componente es b, = 0. 
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b) El plano de vectores b con b, = 1. 

c) Los vectores b con bb = O (esta es la unión de dos subespacios, el plano 
ba = 0 y el plano b3 = 0). 

d) Todas las combinaciones de dos vectores dados (1, 1, 0) y (2, O, 1). 

e) El plano de vectores (b,, ba, b3) que satisface bz — b2 + 3b, = 0. 


Describa el espacio columna, y el espacio nulo de las matrices 


E! 0003 0 0 o 
= = C = ñ 
a=| o y de E y a 00 
¿Cuál es el menor subespacio de matrices de 3 por 3 que contiene a todas las matrices 
simétricas, y a todas las matrices triangulares inferiores? ¿Cuál es el mayor subespa- 
cio que está contenido en cada uno de estos dos subespacios? 


Se requiere que la suma y la multiplicación por un escalar cumplan las ocho siguien- 
tes condiciones: 





Ele Y +0) e + Y), Eds Ari RIA : 
3. Hay un “Vector cero” único tal: quex + 05 = - 1 para! toda. Ca 
:4Para cada 3 hay u un 1 vector ú único: mx ctal l que xx ENE 0 
3 AA a : | h 
¿2 a F o 

E T.: ce de ELE ex ey 

E, EX e E E 








Js ds 


Ne, 7) 


a) Suponga que la adición en R? suma un 1 extra a cada componente, de modo que 
(3, 1) + (5, 0) es igual a (9, 2) en vez de (8, 1). Si la multiplicación por un escalar 
permanece sin cambio, ¿qué reglas se rompen? 

b) Demuestre que el conjunto de todos los números reales positivos con x + y y cx 
vueltos a definir como de costumbre, igual a xy y x”, es un espacio vectorial. ¿Cuál 
es el “vector cero”? 

c) Suponga que (x,, x2) + (y, ya) se define como (x, + ya, X2 + y1). Con cx = (cxj, 
cx) de costumbre, ¿cuáles de las ocho condiciones no se cumplen? 


Sea P el plano en tres dimensiones con ecuación x + 2y + z = 6. ¿Cuál es la ecua- 
ción del plano P, que pasa por el origen y es paralelo a P? ¿P y Py, son subespacios 
de R3? 


¿Cuáles de los siguientes son subespacios de R”? 


a) Todas las sucesiones como (1, O, 1, 0,... ) que incluyen una infinidad de ceros. 
b) Todas las sucesiones (x,, X2, .. .) con x, = O a partir de un punto. 

c) Todas las sucesiones decrecientes: x Xy+1 É x, para cada j. 

d) Todas las sucesiones convergentes: la xj tiene límite cuando j —> 09. 

e) Todas las progresiones aritméticas: x;+, — x¡ es la misma para toda ]. 

f) Todas las progresiones geométricas e kx, Pro, . . . ) permitiendo toda k y x;. 


¿Cuáles de las siguientes descripciones con correctas? Las soluciones x de 


X1 
E o e: _ [O 
X3 
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16. 


17. 


18. 


FALALOTAD BEGUONAL COMCEPOION DEL URUGUAY 


de 
E a Y 
E ; 
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CONStitUNBnSIi ésto A O ES 
a) Un plano. Ed o IA 
b) Una recta. 
c) Un punto. 
d) Un subespacio. 


e) El espacio nulo de A. 
JA El espacio columna de A. 


Demuestre que el conjunto de matrices no singulares de 2 por 2 no es un espacio vec- 
torial. También demuestre que el conjunto de matrices singulares de 2 por 2 no es un 
espacio vectorial. 


La matriz A = l E es un “vector” en el espacio M de todas las matrices de 2 


por 2. Escriba el vector cero en este espacio, el vector 5A y el vector —A. ¿Qué ma- 
trices están en el menor subespacio que contiene a A? 


a) Describa un subespacio de M que contenga a A = b 3 peronoaB = É El 
b) Si un subespacio de M contiene a A y a B, ¿debe contener a f? 
c) Describa un subespacio de M que contenga matrices diagonales diferentes de cero. 


Las funciones f(x) = 2 y g(x) = 5x son “vectores” en el espacio vectorial Y de todas 
las funciones reales. La combinación 3f(x) — 42 (x) es la función h() = . ¿Cuál 
regla se rompe si al multiplicar f(x) por c se obtiene la función f(cx)? 





Si la suma de los “vectores” f(x) y g (<) en E se define como f (g(x)), entonces el ““vec- 
tor cero” es g(x) = x. Considere la multiplicación por un escalar de costumbre cf (x), 
y encuentre dos reglas que no se cumplen. 


Describa el menor subespacio del espacio vectorial M de las matrices de 2 por 2 que 


contiene 
E 0 O 1 la 0 050 
a) . 4 É Al e p o o de 


o lo o) o lo ojo do 1 


Sea P el plano en R? con ecuación x + y — 2z = 4. ¡El origen (0, O, 0) no está en P! 
Encuentre dos vectores en P, y compruebe que su suma no está en P. 


P, es el plano que pasa por (0, O, 0) y es paralelo al plano P del problema 15, ¿Cuál es 
la ecuación de P¿? Encuentre dos vectores en Pp, y compruebe que su suma está en Po. 


Los cuatro tipos de subespacios de R* son planos, rectas, R* mismo, o Z que sólo con- 
tiene a (0, O, O). 

a) Describa los tres tipos de subespacios de R?. 

b) Describa los cinco tipos de subespacios de R”. 


a) La intersección de dos planos que pasan por (0, O, 0) probablemente es una 
aunque puede ser un . ¡No puede ser el vector cero Z! 

b) La intersección de un plano que pasa por (0, O, 0) con una recta que pasa por (0, O, 
O) probablemente es un _____, aunque puede serun _____ 

c) SiS y T son subespacios de R”, su intersección S M T (vectores en ambos subes- 
pacios) es un subespacio de R?. Compruebe los requerimientos sobre x + y y Cx. 


> 








16 


Capítulo 2 Espacios vectoriales 


19, 


20. 


Suponga que P es un plano que pasa por (0, O, 0) y que L es una recta que pasa por 
(0, O, 0). El menor espacio vectorial que contiene tanto a P como aL es o 








¿Falso o verdadero? para M = todas las matrices de 3 por 3 (compruebe la suma uti- 
lizando un ejemplo). 

a) Las matrices simétricas sesgadas en M (con A* = —A) constituyen un subespacio. 
b) Las matrices simétricas en M (con A* + A) constituyen un subespacio. 

c) Las matrices que tienen a (1, 1, 1) en su espacio nulo constituyen un subespacio. 


Los problemas 21 a 30 son sobre espacios columna C(4), y la ecuación Ax = b. 


21. 


22, 


23. 


24. 


As 


26. 


27 


28. 


Describa los espacios columna (rectas o planos) de estas matrices particulares: 
1 100 1.0 
A=10 0 y B=1J0 2 y C=-=j2 0l. 
O 0 2 100 0 0 


¿Para qué miembros derechos (encuentre una condición sobre b,, b,, b3) los siguien- 
tes sistemas son resolubles? 


1 4 Z X1 by 1 4 po b; 
a=12 3 (4d del =]b.. DE ES E - b 
=1 -4 21 1x5 ba -1 -—4]| Y? by 


A1 sumar el renglón 1 de A al renglón 2 se obtiene B. Al sumar la columna 1 a la co- 
lumna 2 se obtiene C. Una combinación de las columnas de también es una com- 
binación de las columnas de A. De las siguientes matrices, ¿cuáles tienen la misma 
columna _____? 


1 Y 22 IS 
IS O O 





¿Para qué vectores (b,, b», b3) los siguientes sistemas tienen una solución? 

yl 1 X1 by LL. X1 b; 

0 1 li|ilx¡=Jbil y JO 1 1] jx|=]jbl. 

¿ARO 0 | X3 b; 0.0 50 X3 b3 
(Recomendado) Si a una matriz A se suma una columna extra b, entonces el espacio co- 
lurmna se vuelve más grande, a menos que . Proporcione un ejemplo en el que el 





espacio columna se vuelva más grande, y un ejemplo en que no lo haga. ¿Por qué 
Ax = b es resoluble exactamente cuando el espacio columna no se vuelve más grande 
al incluir a b? 


Las columnas de A B son una combinación de las columnas de A. Esto significa: El 
espacio columna de A B está contenido en (y quizá es igual a) el espacio columna de 
A. Proporcione un ejemplo en el que los espacios columna de A y AB no sean iguales. 


S1 A es cualquier matriz invertible de 8 por 3, entonces su espacio columna es : 
¿Por qué? 

¿Falso o verdadero? (proporcione un contraejemplo si es falso). 

a) Los vectores b que no están en el espacio columna C(4) constituyen un subespacio. 
b) Si C(A) contiene sólo al vector cero, entonces A es la matriz cero. 


c) El espacio columna de 24 es igual al espacio columna de A. 
d) El espacio columna de A — / es igual al espacio columna de A. 
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29. Construya una matriz de 3 por 3 cuyo espacio columna contenga a (1, 1,0) y a (1, 0, 
1) pero no a (1, 1, 1). Construya una matriz de 3 por 3 cuyo espacio columna sea só- 
lo una recta. 


30. Si el sistema de 9 por 12 Ax = bes resoluble para toda b, entonces C(4) = 


31. ¿Por qué R*” no es un subespacio de R?? 


2.2 CÓMO RESOLVER Ax = 0 Y Ax = bh 


El capítulo 1 se centró en matrices invertibles cuadradas. Había una solución de Ax = b, 
que era x = A" !b, Esta solución se encontró por eliminación (y no calculando A”*). Una 
matriz rectangular trae nuevas posibilidades: U puede no tener un conjunto completo de pi- 
votes. Esta sección aborda el tema de ir de U a una forma reducida R: la matriz más sim- 
ple que puede obtenerse con eliminación. R revela de inmediato todas las soluciones. 

Para una matriz invertible, el espacio nulo sólo contiene a x = O (multiplicado Ax = 0 
por A7?). El espacio columna es todo el espacio (4x = b no tiene solución para toda b). Las 
nuevas preguntas surgen cuando el espacio nulo contiene más que al vector cero y/o el es- 
pacio columna contiene menos que todos los vectores: 


1. Cualquier vector x, en el espacio nulo puede sumarse a una solución particular x,. Las 
soluciones de todas las ecuaciones lineales tienen esta forma: x = x, + X,,: 


Solución completa Ax, = b, y Ax = 0 producen A(x, + x,) = b. 


2. Cuando el espacio columna no contiene a toda b en R”, se requieren las condiciones 
sobre b para hacer resoluble a Ax = b. 


Un ejemplo de 3 por 4 es un tamaño aceptable. Se escribirán todas las soluciones de 
Ax = 0, Se encontrarán las condiciones para que b esté en el espacio columna (de modo 
que Ax = b sea resoluble). El sistema de 1 por 1 Ox = b, con una ecuación y una incógni- 
ta, presenta dos posibilidades: 


Ox = b no tiene soluciones a menos que b = 0. El espacio columna de la matriz cero de 
1 por 1 sólo contiene a b = O. 


Ox = 0 tiene una infinidad de soluciones. El espacio nulo contiene a toda x. Una solu- 
ción particular es x, = 0, y la solución completa es x = x, + x, = O + (cualquier x). 


Admito que es sencillo. Si se pasa a una matriz de 2 por 2, la cuestión se vuelve más inte- 


resante. La matriz E 2! no es invertible: y + z = b, y 2y + 2z = b, suele no tener 


solución. 


No hay solución a menos que b, = 2b,. El espacio columna de A sólo contiene bs 
que son múltiplos de (1, 2). 


Cuando b, = 2b,, hay una infinidad de soluciones. Una solución particular de 
y+2=2y2y+22=4esx, = (1, 1). El espacio nulo de A en la figura 2.2 con- 
tiene a (—1, 1) y a todos sus múltiplos x, = [—c, C): 


Solución y+2=2 1 —1 a 
completa 2y+22=4 es resuelto por Xp +xX» E Cc | . H qe 


A A PX Pr 
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todas las : 
La recta de todas las soluciones = = Ly + La 
H = solución particular mas corta tp 


15] = solución particular MATLAB Ab 
y 
espacio nulo AZ, == 0 


Figura 2.2 Las rectas paralelas de soluciones de Ax, = 0 y E 2] 2] E 


Forma escalonada U y forma reducida por renglones R 


Se empieza por simplificar la matriz de 3 por 4, primero a U y luego a R: 


1 E 
Ejemplo básico A = 2 6 9 Ti. 
el. Hd 3 


El pivote a,, = 1 es diferente de cero. Las operaciones elementales de costumbre produ- 
cen ceros en la primera columna abajo de este pivote. Las malas noticias aparecen en la co- 
lumna 2: 


1 MES A 
En la columna 2 no hay pivote 4>j0 0 3 31 
0.0 6 6 


El candidato a segundo pivote se volvió cero: esto es inaceptable. Abajo de ese cero se bus- 
ca un elemento diferente de cero, intentando realizar un intercambio de renglones. En este 
caso el elemento en cuestión también es cero. Si A fuese cuadrada, lo anterior indicaría que 
la matriz es singular. Con una matriz singular, de cualquier forma es de esperar problemas, 
y no hay ninguna razón para detenerse. Todo lo que puede hacerse es proceder a la siguien- 
te columna, donde el elemento pivote es 3. Al restar dos veces el segundo renglón del ter- 
cero, se llega a U/: 


LI A 
Matriz escalonada U == 10 00. 3d Sl 
0-00 0 


Hablando estrictamente, se procede a la cuarta columna. En la tercera posición pivote hay 
un cero, y no puede hacerse nada. U es triangular superior, pero sus pivotes no están en la 
diagonal principal. Los elementos diferentes de cero de U muestran un “patrón escalona- 
do”, o forma escalonada. Para el caso de 5 por 8 en la figura 2.3, los elementos indicados 
con un asterisco pueden o no ser cero. 

Esta forma escalonada U, siempre puede obtenerse, con cero abajo de los pivotes: 


1. Los pivotes son los primeros elementos diferentes de cero en sus renglones. 

2. Abajo de cada pivote hay una columna de ceros, obtenida por eliminación. 

3. Cada pivote está a la derecha del pivote en el renglón de arriba. Esto produce el pa- 
trón escalonado, y los renglones cero aparecen al último. 
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Figura 2.3 Elementos de una matriz escalonada U de $5 por 8 y su forma reducida R. 


Debido a que se empezó con A y se terminó con U, seguramente el lector pregunta- 
rá: ¿Se tiene A = LU como antes? No hay razón para lo contrario, ya que los pasos de eli- 
minación no cambiaron. Cada paso sigue restando un múltiplo de un renglón de un renglón 
abajo de él. El inverso de cada paso, suma el múltiplo que fue restado. Estos inversos vie- 
nen en el orden correcto para colocar los multiplicadores directamente en £: 


1 0. 0 
Triangular inferior L = 2 ED y A = LU. 
sd 7 | 


Observe que £ es cuadrada. Tiene el mismo número de renglones que A y U. 

La única operación que no es necesaria en nuestro ejemplo, aunque sí es necesaria en 
términos generales, es el intercambio de renglones por una matriz permutación P. Debido 
a que cuando no hay pivotes disponibles se prosigue con la siguiente columna, no es nece- 
sario suponer que Á es no singular. A continuación se proporciona PA = LU para todas las 
matrices: 


sinasa 


Ahora viene R. Es posible avanzar más que hasta U, con la finalidad de hacer aún 
más sencilla a la matriz. El segundo renglón se divide entre su pivote 3, de modo que fo- 
dos los pivotes son 1. Luego, el renglón pivote se utiliza para obtener cero arriba del pi- 
vote. Esta vez, se resta un renglón de un renglón más arriba. El resultado final (a mejor 
forma que puede obtenerse) es la forma escalonada por renglones R: 


A ES MO O 13.0 -1 
003.3 > JO 0 11 j0 01 1| =R. 
000020 0000-00 0.0.0 0 


La matriz R es el resultado final de la eliminación sobre A. MATLAB usa el comando KR = 
rref(A). ¡Por supuesto, rref(R) proporciona nuevamente R! 

¿Cuál es la forma reducida por renglones de una matriz invertible cuadrada? En este 
caso R es la matriz identidad. Hay un conjunto completo de pivotes, todos iguales a 1, con 
ceros arriba y abajo. Así, rref(A) = /, cuando A es invertible. 

Para una matriz de 5 por 8 con cuatro pivotes, en la figura 2.3 se muestra la forma re- 
ducida R. Sigue conteniendo una matriz identidad en los cuatro renglones pivote, y en 
las cuatro columnas pivote. A partir de R rápidamente se encuentra el espacio nulo de A. 
Rx = O tiene las mismas soluciones que Ux = O y Ax = 0. 





A A A 





! 
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Variables pivote y variables libres 


Nuestra meta es leer todas las soluciones de Rx = O. Los pivotes son cruciales: 


u 

Espacio nulo de R y A: lo E 
(las columnas pivote Re=S 1000 144 107 , : 
están en negritas) 0 0 0 0 a 


Las incógnitas u, v, w, y se presentan por grupos. Un grupo contiene las variables pivote, 
las que corresponden a las columnas con pivotes. Las columnas primera y tercera contie- 
nen a los pivotes, de modo que u y w son las variables pivote. En otro grupo está integra- 
do por las variables libres, que corresponden a las columnas sin pivotes. Éstas son las 
columnas segunda y cuarta, por lo que las variables libres son Y y Y. 3 

Para encontrar la solución más general de Rx = 0 (o, de manera equivalente, de Ax = 
0), es posible asignar valores arbitrarios a las variables libres. Suponga que estos valores se 
denominan simplemente v y y. Las variables pivote están determinadas completamente en 
términos de y y y: 


il 


u+3v-y=0 produce u =-—3u+ y 


Ai w+y=0 produce  w= y (01m 


Hay un “doble infinito” de soluciones, con Y y Y libres e independientes. La solución com- 
pleta es una combinación de dos soluciones especiales: 


' , —3v + y 
El espacio nulo contiene a A 


—3 
= E (2) 
todas las combinaciones de E A 0 2 1-1] 
0 


, ; 574 
las soluciones especiales y 1 


Por favor, Observe nuevamente esta solución completa de Rx = O y Ax = O. La solución 
especial (—3, 1, O, 0) tiene a las variables libres v = 1, y y = 0. Las variables libres de la 
otra solución especial (1, 0, —1, 1) son v = 0, y y = 1. Todas las soluciones son combina- 
ciones lineales de estas dos soluciones. La mejor forma de encontrar todas las soluciones 
de Ax = 0 es a partir de las soluciones especiales: 


1. Después de llegar a Rx = 0, identificar las variables pivote, y las variables libres. 

2. Asignar a una variable libre el valor 1, igualar a cero las demás variables libres, y re- 
solver Rx = O para las variables pivote. Esta x es una solución especial. 

3. Cada variable libre produce su propia "solución especial” por el paso 2. Las combina- 


ciones de las soluciones especiales constituyen el espacio nulo: todas las soluciones 
de Ax = 0. 


Dentro del espacio tetradimensional de todos los vectores posibles x, las soluciones de 
Ax = 0 constituyen un subespacio bidimensional: el espacio nulo de A. En el ejemplo, 
N(4) es generado por los vectores especiales (3, 1, O, 0) y (1, 0, —1, D). Las lo 
nes de estos dos vectores producen todo el espacio nulo. a 

Aquí hay un pequeño truco. Las soluciones especiales son especialmente fáciles a 
partir de R. Los números 3 y O y —1 y 1 están en las “columnas no pivote” de R. Para 


encontrar las variables pivote (no las libres), invierta sus signos en las Ea e 
peciales. Escribiré las dos soluciones especiales de la ecuación (2) en una matriz /N, de 


: y , TIA ORINAR 
A ON e AOL UBIERA NDA EOL 
aro EN SE UR SE AO REDES 


DRA SECTA y o A 
CA RA 


ON 
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espacio nulo, para que el lector vea el patrón claro: 


=> 1| noes libre 
Matriz del espacio nulo E 1 O| es libre 
(las columnas son soluciones especiales) NN O —il noeslibre 


O 1i eslibre 


Los valores de las variables libres son 1 y 0. Cuando las columnas libres se movieron al 
miembro derecho de la ecuación (2), sus coeficientes de 3 y O y —1 y 1 cambiaron de sig- 
no. Esto determinó las variables pivote en las soluciones especiales (las columnas de MN). 
Este es el momento de reconocer un teorema extremadamente importante. Suponga 
que una matriz tiene más columnas que renglones, n > m. Debido a que m renglones pue- 
den aceptar cuando mucho a m pivotes, por lo menos debe haber n — m variables libres. 
Hay aún más variables libres si algunos renglones de R se reducen a cero; pero no impor- 
ta el caso: por lo menos una variable debe ser libre. A esta variable libre puede asignarse 


cualquier valor, lo cual lleva a la siguiente conclusión: 





Debe haber una infinidad de soluciones, ya que cualquier múltiplo cx también satisfa- 
ce A(cx) = O. El espacio nulo contiene a la recta que pasa por x. Y si hay variables libres 
adicionales, el espacio nulo se convierte en más que justo una recta en el espacio n-dimen- 
sional. El espacio nulo tiene la misma “dimensión” que el número de variables libres, y 
las soluciones especiales. 

La idea central: la dimensión de un subespacio, se precisará en la siguiente sección. 
Para el espacio nulo se cuentan las variables libres. ¡Para el espacio columna se cuentan las 


variables pivote! 


Cómo resolver Ax = b, Ux = c y Rx = d 


El caso b + 0 es bastante distinto al caso b = 0. Las operaciones en los renglones sobre A 
también deben actuar sobre el miembro derecho (en b). Se empieza con las letras (b,, bz, 
b3) para encontrar la condición de solubilidad para que b esté en el espacio columna. Lue- 
go se escoge b = (1, 5, 5) y se encuentran todas las soluciones x. 

Para el ejemplo original Ax = b = (b,, ba, b3), a ambos lados se aplican las operacio- 
nes que llevaron de A a U. El resultado es un sistema triangular superior Ux = c: 


NE E Ro, A b 
Ux=c e E b=% | (3) 
0000 E b3 — 2b2 +5b, 


El vector c en el miembro derecho, que aparecía después de los pasos de eliminación ha- 
cia adelante, es justo L”*b, como en el capítulo previo. Ahora se inicia con Ux = c. 

No resulta evidente que estas ecuaciones tengan una solución. La tercera ecuación pre- 
senta serias dudas, ya que su miembro izquierdo es cero. Las ecuaciones son inconsisten- 
tes a menos que bz —2b, + 5b, = 0. Aunque haya más incógnitas que ecuaciones, puede 
no haber solución. Conocemos otra forma para contestar la misma pregunta: Ax = b pue- 
de resolverse si y sólo si b está en el espacio columna de A. Este subespacio proviene de 


las cuatro columnas de A (¡no de U!): 
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Las columnas de A 1 3 3 2 
“seneran” el 2 61; 91, da 
espacio columna ==] ES 3 Ze 





Aunque hay cuatro vectores, sus combinaciones sólo llenan un plano en el espacio tridimen- > 
sional. La columna 2 es tres veces la columna 1. La cuarta columna es igual a la tercera me- 138 
nos la primera. Estas columnas dependientes, la segunda y la cuarta, son exactamente las 
que carecen de pivotes. 4 

El espacio columna C(4) puede describirse en dos formas distintas. Por una parte, es Es; E 
el plano generado por las columnas 1 y 3. Las otras columnas están en ese plano, y nocon- E 
tribuyen con nada nuevo. De manera equivalente, es el plano de todos los vectores b que 3 
cumplen bz — 2b, + 5b, = 0; esta es la restricción si el sistema ha de ser resoluble. ¡To- 
da columna satisface esta restricción, de modo que está forzada sobre b! Geométrica- 
mente, se verá que el vector (5, —2, 1) es perpendicular a cada columna. 

Si b pertenece al espacio columna, las soluciones de Ax = b son fáciles de encontrar. 
La última ecuación en Ux = c es 0 = 0. A las variables libres v y y, es posible asignarles 
valores cualesquiera, como antes. Las variables pivote u y w siguen determinándose por 
sustitución hacia atrás. Para un ejemplo específico con b3 — 2b, + 5b, = 0, se escoge 





b= (1, 5, 5): 
e e 1 A 
o as AS > Sl al 


La eliminación hacia adelante produce U a la izquierda y c a la derecha: 


el 1 
Ux=c a E E 
0.0.0.0], 0 


La última ecuación es O = 0, como era de esperarse. La sustitución hacia atrás proporciona 


3w +3y=3 O w= l-y 
u + 3u +3w +2y =1 O ti 7 


De nuevo, hay una infinidad de soluciones: y y y son libres; u y w no lo son: 


Solución completa. : (4) 





Eca E 


Lo anterior contiene todas las soluciones de Ax = O, más la nueva x, = (—2, 0, 1, 0). Es- 
ta x, es una solución particular de Ax = b. Los dos últimos términos con y y y producen 
más o liciones (ya que cumplen Ax = 0). Toda solución de Ax = b es la suma de una so- 
lución particular, y una solución de Ax =0: 








ni17304 
b 
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La solución particular en la ecuación (4) proviene de haber resuelto la ecuación con to- 
das las variables libres iguales a cero. Esta es la única parte nueva, porque el espacio nu- 
lo ya estaba calculado. Cuando la ecuación en el recuadro se multiplica por A, se obtiene 
AX completa == DS O: 

Geométricamente, las soluciones llenan de nuevo una superficie bidimensional, pero 
no es un subespacio. No contiene a x = O. Es paralelo al espacio nulo que se tenía ante- 
riormente, desplazado por una solución particular .x,, como se muestra en la figura 2.2. La 
ecuación (4) es una forma aceptable de escribir la respuesta: 


1. Reducir Ax = ba Ux =cC. 

2. Con las variables libres = 0, encontrar una solución particular de Ax, = b y Ux, = c. 

3. Encontrar las soluciones especiales de Ax = 0 (o de Ux = 0 o de Rx = 0). Cada varia- 
ble libre, a su vez, €s 1. Así, x = x, + (cualquier combinación x, de soluciones 
especiales). 


Cuando la ecuación era Ax = O, ¡la solución particular era el vector cero! Esto se ajusta al 
patrón, aunque Xparticular = O no se escribió en la ecuación (2). Ahora .x, se sumó a las so- 
luciones del espacio nulo, como en la ecuación (4). 

Pregunta: ¿cómo la forma reducida R hace aún más clara esta solución? Se verá en el 
ejemplo. La ecuación 2 se resta de la ecuación 1, y luego la ecuación 2 se divide entre su 
pivote. En el miembro izquierdo, esto produce R, como antes. En el miembro derecho, es- 
tas operaciones cambian c = (1, 3, 0) a un nuevo vector d = (—2, 1, 0): 


u 
Ecuación reducida : ; ; : Miiporas ES (S) 
Rx =d wl | ol 

9.050 50 E 0 


tl 


La solución particular x, (una de muchas opciones) tiene las variables libres v = y = 0. 


Las columnas 2 y 4 pueden ignorarse. Luego, de inmediato se tiene u = —2 y w = l, exac- 
tamente como en la ecuación (4). Los elementos de d van directamente hacia x,. ¡Esto 
se debe a que la matriz identidad se encuentra en las columnas pivote de R! 

A continuación se resumirá esta sección, antes de presentar otro ejemplo. La elimina- 
ción revela las variables pivote y las variables libres. Si hay r pivotes, entonces hay r va- 
riables pivote, y n — r variables libres. A este número importante r se asigna un nombre: 
se trata del rango de la matriz. 





Ahora el lector puede ver cómo es crucial el rango r. Este cuenta los renglones pivote en 
el “espacio renglón” y las columnas pivote en el espacio columna. En el espacio nulo hay 
n — r soluciones especiales. Hay m — r condiciones de solubilidad sobre bo c o d. 


RR erotic 
" 
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Otro ejemplo desarrollado 


La representación completa utiliza eliminación, y columnas pivote para encontrar el espa- 
cio columna, el espacio nulo y el rango. La matriz A de 3 por 4, tiene rango 2: 


1x; + 2x2 + 3x3 + SXa =b, 
Ax=b es 2x, + 4 +8x3 + 1l2x, = ba (6) 
3x SE 6x - 7x3 + 13x4 a b3 
Reducir [A b] a TU c], para llegar a un sistema triangular Ux = c. 
Encontrar la condición sobre b,, b,, by para tener una solución. 
Describir el espacio columna de A: ¿Cuál plano en R?? 
Describir el espacio nulo de A: ¿Cuáles soluciones especiales en R*? 


Encontrar una solución particular de Ax = (0, 6, —6) y la solución completa x, + Xy. 
Reducir [U c] a [R d]: soluciones especiales de R y x, de d. 


> 


DMA 


Solución (¡Observe cómo el miembro derecho se incluye como una columna adicional!) 


1. Los multiplicadores en la eliminación son 2 y 3 y — 1, tomando [A b] a [U cl]. 


ES A LAZo a O ¡E 
2 4 8 12 ba > 0 0 2 Z ba si 2b, —> 10022 bh, E 2b, 
A 0-02 =2lb3 3D 0 0 0 0/lb3+ b> — 5b, 


2.  Laúltima ecuación muestra la condición de solubilidad b3 + b, — 5b, = 0. Así, 0 = 0. 
3.  Elespacio columna de A es el plano que contiene a todas las combinaciones de las co- 
lumnas pivote (1, 2, 3) y (3, 8, 7). Segunda descripción: El espacio columna contie- 
ne a todos los vectores con b3 + b, — 5b, = 0. Esto hace resoluble a Ax = b, de modo 
que b está en el espacio columna. Todas las columnas de A pasan esta prueba b3 + 
b> — 5b, = 0. Esta es la ecuación del plano (en la primera descripción del espacio 


columna). 
4. Las soluciones especiales en N tienen las variables libres x, = 1,x4 = 0 y x2 = 0, 
Xa= 1: 
Matriz del espacio nulo e 
Soluciones especiales de Ax = 0 N= 1 0 
Sustitución hacia atrás en Ux = 0 O po 
Simplemente cambia signos en Rx = 0 0 ] 


5. Se elige b = (0, 6, —6), que tiene bz + b, — 5b, = O. La eliminación lleva Ax = ba 
Ux = c = (0, 6, 0). Se sustituye hacia atrás con las variables libres = 0: 
—9 
Solución particular de Ax, =(0,6,6) 1p=| IS" 
O | es libre 


La solución completa de Ax = (0, 6, —6) es (esta Xp) + todas las x,,). 
6. EnlaR reducida, la tercera columna cambia de (3, 2, 0) a(0, 1, 0). El miembro dere- E 
cho c = (0, 6, 0) se convierte en d = (—9, 3, 0). Así, —9 y 3 van hacia xp: E 





1.2.3 s|0 1.2.0 2|-9 o 
[U c=|0 0 2 2|6|—[R d]=|0 O 1 1]| 31. , 
0.0.0 0j0 07050:01: 0 > 
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Esa matriz final [R 4] es rref( [A b]) = rref( [U c]). Los números 2 y O y 2 y 1 en las 


columnas libres de RX tienen signo opuesto en las soluciones especiales (la matriz espacio 
nulo NV). Rx = d, revela todo. 





Conjunto de problemas 2.2 


1. 


2. 


Construya un sistema con más incógnitas que ecuaciones, pero sin solución. Cambie 
el miembro derecho a cero, y encuentre todas las soluciones x,,. 

Reduzca A y B a forma escalonada para encontrar sus rangos. ¿Qué variables son li- 
bres? 


E Z.0 1 1 E 
A=j|0 1 1 0 B=J|14 3 6]. 
EA e $ AU >> Ad 


Encuentre las soluciones especiales de Ax = O y Bx = 0. Encuentre todas las solucio- 
nes. 


Encuentre la forma escalonada de U, las variables libres, y las soluciones especiales: 
OS o 
a="0 20 | o = [7 
Ax = bes consistente (tiene una solución) cuando b satisface b, = . Encuentre 
la solución completa en la misma forma que la ecuación (4). 


Efectúe los mismos pasos que en el problema previo para encontrar la solución com- 
pleta de Mx = b: 


o 0 > 
o Eb 
oro alo: 

356 e 


Escriba las soluciones completas x = x, + x, de estos sistemas, como en la ecuación 


(4): 
NE e E ed E 
e E 4 2.4 4 ale 
YU) w 


Describa el conjunto de miembros derechos b obtenibles (en el espacio columna) para 
Es) E by 
o 1 B e ba á 
PS b3 


al encontrar las restricciones sobre b que hacen que la tercera ecuación sea O = O (des- 
pués de la eliminación). ¿Cuál es el rango, y una solución particular? 


€ 


Encuentre el valor de c que hace posible resolver 4x = b, y resuélvalo: 


uS+ v+Q2w=-=2 
Zu +3u=- w=5 
Zu +4du + w=c. 
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8. 


10. 


11. 


12. 


13. 


14. 


13: 


¿Cuáles deben ser las condiciones sobre b, y b, (en caso de haber alguna) para que 


Ax = b tenga solución? 
ES _ 01 
A=| 40 Al >= (e 
Encuentre dos vectores en el espacio nulo de A, así como la solución completa de 
Ax = b. 


a) Encuentre las soluciones especiales de Ux = 0. Reduzca U a R, y repita lo ante- 
rior: 


e 0 

Ux=|o0 0 1 2| [2] =]|of. 

070 OOO 0 
X4 


b) Si el miembro derecho se cambia de (0, 0, 0) a (a, b, 0), ¿cuáles son todas las solu- 
ciones? 


Encuentre un sistema Ax = b de 2 por 3 cuya solución completa es 


1 1 
x= 12 | +wil3j. 
0 1 


Encuentre un sistema de 3 por 3 con estas soluciones exactamente cuando b, + b, = 
bz. 


Escriba un sistema Ax = b de 2 por 2 con muchas soluciones x,,, pero sin solución x,. 
(En consecuencia, el sistema no tiene solución.) ¿Cuáles bs permiten una x,? 


¿Cuáles de las siguientes reglas proporcionan una definición correcta del rango de A? 


a) El número de renglones diferentes de cero en R. 

b) El número de columnas menos el número total de renglones. 
Cc) El número de columnas menos el número de columnas libres. 
d) El número de 1s en R. 


Encuentre las formas escalonadas reducidas por renglón R, y el rango de las siguien- 
tes matrices: 

a) La matriz de 3 por 4 de todos los 1s. 

b) La matriz de 4 por 4 con ay = (— y 

c) La matriz de 3 por 4 con a; = (-1Y. 


Encuentre R para cada una de las siguientes matrices (en bloque), así como las solu- 
ciones especiales: 


0 0 0 
A=|0 0 3 B=[A 4] c=|4 a 
o 


Si primero aparecen las r primeras variables pivote, entonces la R reducida debe ver- 
se como 


ES e Tes de r por r 
0 0 Fes aer porn —F 


¿Cuál es la matriz espacio nulo N que contiene las soluciones especiales? 








16. 


Te 


18. 


y9. 


20. 


21 


e 


22 


ze 


23; 


26. 


27. 


28. 
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Suponga que todas las r variables pivote aparecen al último, Describa los cuatro blo- 
ques en la forma escalonada reducida de m por n (el bloque B debe ser de r por r): 


A B 
R=(5 pl 
¿Cuál es la matriz espacio nulo N de las soluciones especiales? ¿Cuál es su forma? 


(Problema tonto) Describa todas las matrices A, y A, de 2 por 3 con formas escalona- 
das por renglones R, y R,, tales que R, + R,es la forma escalonada por renglones de 
A; + A). ¿Es cierto que R, = A; y R, = A, en este caso? 


Si A tiene r columnas pivote, entonces A* tiene r columnas pivote. Proporcione un 
ejemplo de 3 por 3 para el que los números de columna son distintos para A y A?. 


¿Cuáles son las soluciones especiales de Rx = 0 y R* y = 0 para las siguientes R? 


20.2 3 AS OS: 
R=JY0 1 4 5 R=j0 0 0l. 
0 0:20:50 OO) 20 


Si el rango de A es r, entonces tiene una submatriz $ de r por r que es invertible. En- 
cuentre esa submatriz $ a partir de los renglones pivote, y las columnas pivote para ca- 


da A: a 
VIDAS LS 
a=| | a=| i ao o ol 
| E * DE O o 0.1 


Explique por qué los renglones pivote y las columnas pivote de A (no R) siempre pro- 
porcionan una submatriz invertible de A de r por r. 


Encuentre los rangos de AB y AM (matriz de rango 1 multiplicada por una matriz de 


rango 1): 
Ma A Eb 
a=|) A y B=| 1.5 : y M=|: rl 


Al multiplicar las matrices de rango 1 4 = uv" y B = wz" se obtiene uz* multiplica- 
da por el número . El rango de AB es 1 a menos que = 0, 








. Toda columna de AB es una combinación de las columnas de A. Así, las dimensiones 


de los espacios columna proporcionan rango(AB) = rango(A4). Problema: También 
demuestre que rango(A B) <= rango(Bb). 


(Importante) Suponga que A y B son matrices de n por n, y que AB = 1. A partir de ran- 
go(AB) < rango(A4), demuestre que el rango de A es n. Así, A es invertible, y B debe ser 
su inversa por ambos lados. En consecuencia, BA = I (¡lo cual no es tan evidente! ). 


S1 A es de 2 por 3 y C es de 3 por 2, a partir de su rango demuestre que CA + /. Pro- 
porcione un ejemplo en el que AC = /. Para m < n, una inversa derecha no es una in- 
versa izquierda. 


Suponga que A y B tienen la misma forma escalonada reducida por renglones R. Ex- 
plique cómo cambiar de A a B, mediante operaciones elementales en los renglones. 
Así, B es igual a una matriz multiplicada por A. 





Toda matriz de m por n de rango r se reduce a (mn por r) multiplicada por (r por n): 
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Escriba la matriz de 3 por 4 A, al inicio de esta sección, como el producto de la ma- 
triz de 3 por 2 a partir de las columnas pivote, y la matriz de 2 por 4 de R: 


O SS 
A = de POE UN 
o A 


29. Suponga que Á es una matriz de m por n de rango r. Su forma escalonada reducida es 
R. Describa exactamente la forma escalonada reducida por renglones de RY (no A5). 


30. (Recomendado) Ejecute los seis pasos que están después de la ecuación (6) para en- 
contrar el espacio columna, y el espacio nulo de A y la solución de Ax = b: 


24564 bj 4 
A=S=123 7 6 b=lbp=13 
DO PL b; 5 
31. Para cada c, encuentre R, y las soluciones especiales de Ax = O: 
O BR 
A=|2 2 4 4 y a=[! 7" Pa 
¿E E 
32. ¿Cuál es la matriz espacio nulo N (de soluciones especiales) para A, B, C? 


A=[1 1] y B=|) o y C=[1 1 1 


Los problemas 33 a 36 son sobre la solución de Ax = b. Siga los pasos proporciona- 
dos en el texto para encontrar x, y x,. Reduzca la matriz aumentada [A b]. 


33. Encuentre las soluciones completas de 


x+3y+32=1 Lo ] 
2x +H6y+9Z=S y 2.56 4 811 =]|3 
7 ESA a OD 2d ; 1 


34. ¿Cuál debe ser la condición sobre b,, b», b3, para que el sistema sea resoluble? Inclu- 
ya a b como una cuarta columna en [4 5]. Encuentre todas las soluciones cuando se 
cumple esa condición: 


xXx ty 21 =b; 
2x + 5y — 42z = b, 
4x + 9y — 87 = ba. 


35. ¿Cuáles son las condiciones sobre b,, bz, b3 b¿ para que cada uno de los siguientes sis- 
temas sea resoluble? Despeje x: 


po by a by 
cae e o UN 
2035 al= 15 A O a AE 
3 9 ba E ba 


36. ¿Cuáles vectores (b,, ba, b3) están en el espacio columna de 4? ¿Cuáles combinacio- 
nes de los renglones de A proporcionan cero? 


lA | A E 
OTRO 2 4 8 


E A 

z . ón EE 7 E Py E 

eE A TEME SS E A e SUENE PALO] o) A Ses 14 
DATE le CA ATAR A IS RA DAS (O e IN, ñ PAGS 107 

A TS A NO AN A A APA IAS 


dd NAO E 

AN VO LA PRO 

PEA Li A ES 67 
pr: ñ. ; 





3 





EE 


38. 


37 


40. 


41. 


42. 


43. 


45. 


46. 
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¿Por qué no es posible que un sistema de 1 por 3 tenga x, = (2, 4, 0) y x, = cualquier 
múltiplo de (1, 1, 1)? 

a) Si Ax = b tiene dos soluciones x, y x,, encuentre dos soluciones de Ax = O, 

b) Luego, encuentre otra solución de Ax = b. 


Explique por qué las siguientes afirmaciones son falsas: 
a) La solución completa es cualquier combinación lineal de x, y X;, 
b) Un sistema Ax = b tiene cuando mucho una solución particular. 


c) La solución x, con todas las variables libres iguales a cero es la solución más bre- 
ve (longitud mínima || x ||). (Encuentre un contraejemplo de 2 por 2). 


d) Si A es invertible, entonces no hay solución x,, en el espacio nulo. 
Suponga que la columna 3 de U no tiene pivote. Entonces x5 es una variable el 


vector cero (es) (no es) la única solución de Ax = 0. Si Ax = b tiene una solución, en- 
tonces tiene soluciones. 





Si se conocen x, (variables libres = 0) y todas las soluciones especiales de Ax = b, 
encuentre x, y todas las soluciones especiales para los siguientes sistemas: 


AD [A A] e ab A e HI 


S1 Ax = b tiene una infinidad de soluciones, ¿por qué es imposible que Ax = B (nue- 
vo miembro derecho) tenga una sola solución? ¿Es posible que Ax = B no tenga so- 
lución? 


Escoja el número q de modo que (de ser posible) los rangos sean a) 1, b) 2, c) 3: 
6 4 2 
A e | y B=|: , >| 
9 6 q q q 


. Proporcione ejemplos de matrices A para las cuales el número de soluciones de Ax = 


b sea 

a) O o 1, dependiendo de b. 
b) co, sin importar b. 

c) Do oo, dependiendo de b. 
d) 1, sin importar b. 


Escriba todas las relaciones conocidas entre r y m y nsiAx = b 

a) No tiene solución para alguna b. 

by Tiene una infinidad de soluciones para toda b. 

c) Tiene exactamente una solución para alguna b, y ninguna solución para otra b. 
d) Tiene exactamente una solución para toda bh, 

Aplique la eliminación de Gauss-Jordan (el miembro derecho se convierte en una co- 
lumna extra) a Ux = 0 y Ux = c. Obtenga Rx = 0 y Rx = d: 


12.30 LaS 
pa =(0 530 Es A 


Resuelva Rx = O para encontrar x, (su variable libre es x, = 1). Resuelva Rx = d pa- 
ra encontrar x, (su variable libre es x2 = 0). 
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47. Aplique eliminación con la columna extra para obtener Rx = 0 y Rx = d: 
06 0 2 063 
U 01=10 060 2.0 y E eli=10 0.2 Ele 
00.00 00. 0 5 
Resuelva Rx = O (variable libre = 1). ¿Cuáles son las soluciones de Rx = d? 
48. Reduzca lo siguiente a Ux = c (eliminación gaussiana), y luego a Rx = d: 
OS a 2) 
ASA O =D. 
DOS ASES 10 
Xa 


Encuentre una solución particular x, y todas las soluciones x, del espacio nulo. 
49. Encuentre A y B con la propiedad mencionada, o bien, explique por qué no es posible, 


Bl 
El 


50. La solución completa de Ax = [| es x= 13] +c 0 Encuentre 4. 


I 
a) La única solución de Ax = B es Xx 
3 


tl 


by La única solución de Bx = E | es x 


tl 





ei 


51. El espacio nulo de una matriz A de 3 por 4 es la recta que pasa por (2, 3, 1, 0). +) 
2) ¿Cuál es el rango de Á y la solución completa de Ax = 07? 
b) ¿Cuál es la forma escalonada reducida exacta por renglones R de A? 


52. Reduzca las siguientes matrices A y B a sus formas escalonadas ordinarias U: 


E: E A E 
Ad A=j1l 2 3 6 9 DB=j0 4 4 
OU 2 0.3858 


Encuentre una solución especial para cada variable libre, y describa cada solución de 
Ax = 0 y Bx = 0. Reduzca las formas escalonadas U a R, y destaque con un recuadro 
los renglones pivote y las columnas pivote de la matriz identidad. 


53. ¿Falso o verdadero? (En caso de ser cierto, proporcione una razón, o un contraejem- 
plo si es falso.) 
aj) Una matriz cuadrada no tiene variables libres. 
b) Una matriz invertible no tiene variables libres. 
c) Una matriz de m por n no tiene más de n variables pivote. 
d) Una matriz de m por n no tiene más de m variables pivote. 


54. ¿Existe una matriz de 3 por 3 sin elementos cero para la cual U = R = IP? 


55. Escriba tantos 1s como pueda en una matriz escalonada U de 4 por 7, y en una forma 
reducida R cuyas columnas pivote sean 2, 4, 5. 


56. Suponga que la columma 4 de una matriz de 3 por 5 es toda igual a Os. Entonces xy es 
ciertamente una variable . La solución especial para esta variable es el vector 
Xx 





. 
A 





0d 


58. 


59, 
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Suponga que las columnas primera y última de una matriz de 3 por 5 son iguales (di- 
ferentes de cero). Entonces es una variable libre. Encuentre las soluciones espe- 
ciales para esa variable. 


La ecuación x — 3y — z = O determina un plano en R”. ¿Cuál es la matriz A en esta 
ecuación? ¿Cuáles son las variables libres? Las soluciones especiales son (3, 1, 0) y 
____—. El plano paralelo x — 3y — z = 12 contiene al punto particular (12, O, 0). Todos 
los puntos en este plano tienen la forma siguiente (escriba las primeras componentes): 


zx 
Yi 101 Py eL EZ os 
z 0 0 1 


Suponga que columna 1 + columna 3 + columna 5 = O en una matriz de 4 por 5 con 
cuatro pivotes. ¿Cuál columna carece seguramente de pivote? (¿Y cuál es la variable 
libre?) ¿Cuál es la solución especial? ¿Cuál es el espacio nulo? 


En los problemas 60 a 66 se solicitan matrices (de ser posible) con ciertas propiedades. 


60. 


61. 
62. 


63. 


65. 
66. 
67. 


68. 


69. 


70. 


Construya una matriz cuyo espacio nulo conste de todas las combinaciones de (2, 2, 
01 WO lolo: 


Construya una matriz cuyo espacio nulo conste de todos los múltiplos de (4, 3, 2, 1). 


Construya una matriz cuyo espacio columna contenga a (1, 1, 5) y a(0, 3, 1), y cuyo 
espacio nulo contenga a (1, 1, 2). 


Construya una matriz cuyo espacio columna contenga a (1, 1, 0) y a(0, 1, 1), y cuyo 
espacio nulo contenga a (1, O, 1) y a(0, 0, 1). 


Construya una matriz cuyo espacio columna contenga a (1, 1, 1) y cuyo espacio nulo 
es la recta de múltiplos de (1, 1, 1, 1). 


Construya una matriz de 2 por 2 cuyo espacio nulo sea igual a su espacio columna. 
¿Por qué ninguna matriz de 3 por 3 tiene un espacio nulo igual a su espacio columna? 


La forma reducida R de una matriz de 3 por 3 con elementos elegidos aleatoriamente 
casi seguramente es . ¿Cuál R es virtualmente cierta si la matriz aleatoria A es de 
4 par 3? 





Demuestre con un ejemplo que las tres siguientes afirmaciones suelen ser falsas: 
a) A y A? tienen el mismo espacio nulo. 

b) A y A? tienen las mismas variables libres. 

c) Si Res la forma reducida de rref(4), entonces R? es rref(A*), 


Si las soluciones especiales de Rx = O están en las columnas de estas N, vuelva hacia 
atrás para encontrar los renglones diferentes de cero de las matrices reducidas R: 


LS 0 
N=|1 0 y N=/J0 y N= (matriz vacía de 3 por 1). 
oO 1 1 


Explique por qué A y —A siempre tienen la misma forma escalonada reducida K. 
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Ejemplo 1 


Ejemplo 2 


2.3 INDEPENDENCIA LINEAL, BASE Y DIMENSIÓN 


Por sí mismos, los números m y n proporcionan una representación incompleta del verda- 
dero tamaño de un sistema lineal. La matriz de nuestro ejemplo tenía tres renglones y cua- 
tro columnas, aunque el tercer renglón era sólo una combinación de los dos primeros. 
Después de la eliminación se convirtió en un renglón cero. No afectó el problema homo- 
géneo Ax = 0. Las cuatro columnas también fracasaron en cuanto a ser independientes, y 
el espacio columna degeneró en un plano bidimensional. 

El número importante que está comenzando a surgir (el tamaño verdadero) es el rango 
r. El rango se introdujo como el número de pivotes en el proceso de eliminación. De mane- 
ra equivalente, la matriz final U tiene r renglones diferentes de cero. Esta definición hubie- 
ra podido proporcionarse a una computadora, aunque sería erróneo dejarla ahí, porque el 
rango posee un significado simple e intuitivo: El rango cuenta el número de renglones ge- 
nuinamente independientes en la matriz A. Lo que se busca son definiciones matemáticas, 
más que computacionales. 

El objetivo de esta sección es explicar y usar cuatro conceptos: 


Independencia o dependencia lineal. 

Generación de un subespacio. 

Base de un subespacio (un conjunto de vectores). 
Dimensión de un subespacio (un número). 


ppp 


El primer paso es definir independencia lineal. Dado un conjunto de vectores v;, . 
Y, se buscan sus combinaciones C,V; + C70y +: + Cg¿U4 La combinación trivial, con 
todos los pesos c; = O, evidentemente produce el vector cero: 0v, + :- + + + Ov,¿ = 0. La 
pregunta es si ésta es la única forma de producir cero. En caso afirmativo, los vectores son 
independientes. 

Si con cualquier otra combinación de los vectores se obtiene cero, entonces son de- 
pendientes. 





ZE: Suponga que C1vr +: Pe Co O sólo ocurre - cuando ca = o Cr = O. EN 


h : tonces los vectores ve, > De son linealmente independientes. Si a cs son di-- 
: 3: ferentes de cero, las y vs son linealmente dependientes: Un vector e es, 5 una a combinación 
Mo del los demás. A O PE : E 








La a lineal es fácil de visualizar en el espacio tridimensional, cuando todos 
los vectores salen del origen. Dos vectores son dependientes si están en la misma recta. Tres 
vectores son dependientes si están en el mismo plano. Una elección aleatoria de tres vec- 
tores, sin ningún accidente especial, debe producir independencia lineal (no están en un 
plano). Cuatro vectores siempre son linealmente dependientes en R?. 


Si v, = vector cero, entonces el conjunto es linealmente dependiente. Puede elegirse c, = 
3 y todas las demás c, = 0; esta es una combinación no trivial que produce cero. 


Las columnas de la matriz 


: ES EE 
A = ZU O IA 
muni Dias ES E 0 


son linealmente dependientes, ya que la segunda columna es tres veces la primera. La com- 
binación de las columnas con pesos —3, 1, 0, O proporciona una columna de ceros. 














Ejemplo 3 


Ejemplo 4 
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Los renglones también son linealmente dependientes; el renglón 3 es dos veces el ren- 
glón 2 menos cinco veces el renglón 1. (Esto es lo mismo que la combinación de b,, b,, ba, 
que tuvo que desaparecerse en el miembro derecho para que Ax = b fuera consistente. A 
menos que b3 —2b, + 5b, = O, la tercera ecuación no se convierte en O = 0). 


Las columnas de la siguiente matriz triangular son linealmente independientes: 


342 
No hay ceros en la diagonal A=|0 1 5 
0205 2 
Se busca una combinación de las columnas que produzca cero: 
5 4 2 0 
Se resuelve Ac = 0 0 Mr a 
0 0 Z 0 


Hay que demostrar que c,, €, czestán obligados todos a ser cero. La última ecuación 
proporciona cz = O. Luego, la siguiente ecuación proporciona c, = O, y al sustituir en la 
primera ecuación se obliga a que c, = 0. La única combinación que produce el vector 
cero es la combinación trivial. El espacio nulo de A contiene sólo al vector cero c, = 
C, = 03 =0. 


Las columnas de A son independientes exactamente cuando N(A) = (vector cero). 


Un razonamiento semejante es válido para los renglones de A, que también son inde- 
pendientes. Suponga que 


c1(3, 4, 2) + c2(0, 1, 5) + ca(0, O, 2) = (0, O, O). 


A partir de las primeras componentes se encuentra que 3c, =D oc, = 0. Luego, las segun- 
das componentes proporcionan cz = O, y finalmente cz = O. 

Los renglones diferentes de cero de una matriz en forma escalonada U deben ser in- 
dependientes. Además, si se eligen las columnas que contienen a los pivotes, también son 
linealmente independientes. En el ejemplo previo, con 


Dos renglones independientes : . 4 2 
Dos columnas independientes 0 00 o a ; 


las columnas pivote 1 y 3 son independientes. Ningún conjunto de tres columnas es inde- 
pendiente, y ciertamente tampoco ninguno de cuatro. Es cierto que las columnas 1 y 4 tam- 
bién son independientes, pero si el último 1 cambia a 0, entonces serían dependientes. Por 
tanto, lo que garantiza su independencia son las columnas que contienen a los pivotes. 
A continuación se proporciona la regla general: 






2 E sn - renglones óntos qn cero Ae matriz in escalonada Uy y una matriz 1 re- me E 
| - Jucida R. son: linealmente a También las 3 F -colurmsas ques contienen a 


10. - 0 
DA O 
1 = 0 
ETOOs a 


4 
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Ejemplo 5 


Estas columnas €,, .- ., €, Tepresentan vectores unitarios en las direcciones coordenadas; 
en R*, 
1 0 0 0 
e 0 al O E 1, 
EL 0 > dr 0 > a 1 3 Aran 0 
0 0 0 i 


La mayor parte de los conjuntos de cuatro vectores en R* son independientes. Estos es 
podrían ser el conjunto más seguro. 


Para comprobar la independencia de un conjunto de vectores y;, .... , UVa, Éstos deben 
escribirse en las columnas de A. Luego se resuelve el sistema Ac = 0; los vectores son de- 
pendientes si hay otra solución aparte de c = O, Si no hay variables libres (rango n), no 
existe espacio nulo excepto c = 0; los vectores son independientes. Si el rango es menor 
que nr, entonces por lo menos una variable libre puede ser diferente de cero y las columnas 
son dependientes. 

Un caso reviste especial importancia. Considere que los n vectores tienen m compo- 
nentes, de modo que Á es una matriz de m por n. Ahora suponga que n > m. ¡Hay dema- 
siadas columnas para ser independientes! No puede haber n pivotes, ya que no hay 
suficientes renglones para acomodarlos. El rango es menor que nr. Todo sistema Ac = O con 
más incógnitas que ecuaciones tiene soluciones c * O. 


E 26 Un ¡conjunto dl de n 1 Vectores en a Ro debe ser linealmente. dependiente s si n > m. 


A Lo 
DUNAS A ES Ele dera 
E %n Pis .n A, Vit ASÍ EN mE ARONA ON A 





E cd za 


El lector reconocerá esto como una forma disfrazada de 2C: Todo sistema Ax = O de m por 
n tiene soluciones diferentes de cero sin > m, 


Las tres siguientes columnas en R* no pueden ser independientes: 
¡CE 
ió É 3 el 


Para encontrar la combinación de las columnas con la que se obtiene cero se resuelve 


Ac = 0: 
ME E A: 
A>U= |) 1 4 


Si a la variable libre cz se asigna el valor 1, entonces la sustitución hacia atrás en Uc = O 
proporciona c¿ = —1,c, = 1. Con estos tres pesos, la primera columna menos la segunda 
más la tercera es igual a cero: Dependencia. 


Cómo generar un subespacio 


A, continuación se definirá lo que se entiende por el hecho de que un conjunto de vectores 
generen un espacio. El espacio columna de A es generado por las columnas. Su combina- 
ción produce todo el alii 









] 2H Si un n espacio cala Ve consta de Mas las combinaciones lineales de 01, 

. w£, entonces estos vectores EE el espacio: Todo vector.v.en Ves alguna co 
«binación delas WS: IA 

oe vie de y ws y e -: +cgu para algunos coeficiente 














e 
A 
Ez 





a o es add 
A 


1 
ag 


EN 

3 3 

a Y 
e y 





Ejemplo 6 


Ejemplo 7 
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lan 


Se permite que una combinación distinta de ws proporcione el mismo vector v. Las cs no 
necesitan ser únicas, porque el conjunto generador puede ser excesivamente grande: pue- 
de incluir el vector cero, e incluso a todos los vectores. 


Los vectores w, = (1, 0, 0), wa, = (0, 1, 0), y wz = (—2, 0, 0), generan un plano (el plano 
x-y) en R”. Los dos primeros vectores también generan este plano, mientras w, y w3x sólo 
generan una recta. 


El espacio columna de A es exactamente el espacio generado por sus columnas. El espa- 
cio renglón es generado por los renglones. La definición se hace para ordenar. Al multipli- 
car A por cualquier x se obtiene una combinación de las columnas; es un vector Ax en el 
espacio columna. 

Los vectores de coordenadas e;,..., €, que provienen de la matriz identidad generan 
R”. Todo vector b = (b;,,...,b,)es una combinación de estas columnas. En este ejemplo 
los pesos son las componentes b; mismas: b = b,e, + +++ + b,e,, Sin embargo, ¡las co- 
lumnas de otras matrices también generan R”! 


Base de un espacio vectorial 


Para decidir si b es una combinación de las columnas, se intenta resolver Ax = b, Para de- 
cidir si las columnas son independientes, se resuelve Ax = O, La generación implica al es- 
pacio columna, y la independencia implica al espacio nulo. Los vectores de coordenadas 
€1,..., €. generan R” y son linealmente independientes. En términos bastos, ningún vec- 
tor en ese conjunto se desperdicia. Esto conduce al concepto crucial de base. 





Esta combinación de propiedades es absolutamente fundamental para el álgebra lineal. 
Significa que todo vector en el espacio es una combinación de los vectores de la base, ya 
que éstos generan el espacio. También significa que la combinación es única: Si v = a,v; 
+ +++ + sv y también v = b,v; +: ++ + b¿vz, entonces al restar se obtiene O = 2. (a; — - 
b)Jv; Es ahora que entra en juego la independencia: todo coeficiente a; — b, debe ser cero. 
En consecuencia, a; = b, Hay una y sólo una forma de escribir v como una combinación 
lineal de los vectores de la base. 

Hubiera sido mejor decir de una vez que los vectores de coordenadas €;,..., €, no 
son la única base de R”. Algunas cosas en álgebra son únicas, pero no ésta. Un espacio vec- 
torial tiene una infinidad de bases distintas. Siermpre que una matriz cuadrada es inverti- 
ble, sus columnas son independientes, de modo que son una base de R”. Las dos columnas 
de la siguiente matriz no singular constituyen una base de R”: 


li] 


Todo vector bidimensional es una combinación de estas columnas (¡independientes!). 
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Ejemplo 3 


Ejemplo 9 


El plano x-y de la figura 2.4, es justo R”. El vector v, en sí es linealmente independiente, 
pero fracasa en generar R?. Los tres vectores v,, Uz, U3 Ciertamente generan R?, pero no son 
independientes. Dos vectores cualesquiera de esos, por ejemplo v, y uz, tienen ambas pro- 
piedades: generan el espacio y son independientes. Así, constituyen una base. Observe de 
nuevo que un espacio vectorial no tiene una base única. 


| 
| 


Ya 


Y 
Figura 2.4 Conjunto generador v,, Va, Uz. Bases Y;, Uz Y UV], Uz Y Uz, U3. 


Las cuatro siguientes columnas generan el espacio columna U, pero no son independien- 
tes: 


E MES ANS UNES 
Matriz escalonada U=|0 O 3 1l. 
0000 


Hay muchas posibilidades para la base, pero se propone una opción específica: Las colum- 
nas que contienen pivotes (en este caso la primera y la tercera, que corresponden a las varia- 
bles básicas) constituyen una base de espacio columna. Estas colurmas son independientes, 
y es fácil ver que generan el espacio. De hecho, el espacio columna de U es justo el plano 
x-y dentro de R?. C(U) no es lo mismo que el espacio columna C (4) antes de la eliminación; 
sin embargo, el número de columnas independientes no cambia. 


En resumen: Las columnas de cualquier matriz generan su espacio columna. Si son 
independientes, constituyen una base del espacio columna, sin importar que la matriz sea 
cuadrada o rectangular. Si se pide que las columnas sean una base para todo el espacio R”, 
entonces la matriz debe ser cuadrada e invertible. 


Dimensión de un espacio vectorial 


Un espacio tiene una infinidad de bases distintas, aunque todas estas opciones tienen algo 
en común. El número de vectores de la base es una propiedad del espacio en sí: 







a 2d des 4 2 cualesquiera de un espacio. o vectorial. y contienen e mismo número de 


vectores. Este | número. que es ro por toda 
- im e á 





Hay que demostrar este hecho: Todas las bases posibles contienen el mismo núme- 
ro de vectores. El plano x-y en la figura 2.4 tiene dos vectores en cada base; su dimensión 
ES. 2. 








ASE 2 E A IRA A E E: A AA 


OS 
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ES a u A ¡GUAY 


a A SAN 


En tres dimensiones se requieren tres vectores, ya sea a lo largo de los ejes x-y-z Ó en otras 
tres direcciones (¡linealmente independientes!) La dimensión del espacio R” es n. La di- 
mensión del espacio columna de U en el ejemplo 9 era 2; era un “subespacio bidimensio- 
nal de R3.” La matriz cero es más bien excepcional, ya que su espacio columna contiene 
sólo al vector cero. Por convencionalismo, el conjunto vacío es una base de ese espacio, y 
su dimensión es cero. 

A continuación se pisseñta el lan gran teorema en ca lineal: 





A 2 Es mi A a Y Ay). a ¿w, son a dos bases del mismo, o espacio vectorial, enton- 3 
a ces m= = A. El número de: vectores es seln mismo. A AAN O DO 





A 


Demostración o que q más ws que us (n > m). Se llegará a una contradicción. 
Debido a que las vs constituyen una base, deben generar el espacio. Toda w, puede escri- 
birse como una combinación de las vs: si w; = 4,101, + *** “F 0,18, esta es la primera 
columna de una multiplicación de matrices VA: 


211 
W > wi wa . o” Y n . UV; »... Um : = VA. 


Gm! 


No se conoce cada a,;, pero sí la forma de Á (es de m por n). El segundo vector wa también 
es una combinación de las vs. Los coeficientes de esa combinación llenan la segunda co- 
luna de A. La clave es que A tiene un renglón para cada vu y una columna para cada w. A 
es una matriz corta pero ancha, ya que n > m. Hay una solución diferente de cero para 
Ax =0. Así, VAx = O, que es Wx = O. ¡Una combinación de las ws da cero! Las ws po- 
drían no ser una base, de modo que no es posible que n > m. 

Sim > n, se intercambian las us y las ws y se repiten los mismos pasos. La única for- 
ma de evitar una contradicción es si m = n. Así se termina la demostración de que m = n. 
Repitiendo: La dimensión de un espacio es el número de vectores que hay en cada base. M 


Esta demostración se usó antes para demostrar que todo conjunto de m + 1 vectores 
en R” debe ser dependiente. Las us y las ws no necesitan ser vectores columna: la demos- 
tración fue toda concerniente a la matriz Á de coeficientes. De hecho, puede verse este re- 
sultado general: En un subespacio de dimensión k, ningún conjunto de más de k vectores 
puede ser independiente, y ningún conjunto con menos de k vectores puede generar el es- 
pacio. 

Hay otros teoremas “duales”, de los cuales sólo se menciona uno. Puede empezarse con 
un conjunto de vectores que sea demasiado pequeño o demasiado grande, y terminar con la 
base siguiente: 

a Es conjunto iS independiente e en n Y Y puede: extenderse a una aba Yo, 
Se sumando más vectores si es necesario, CS Ñ a 
el Cualquier conjunto Brescia el en q puede reducirse £ a una base, eliminando tio 

E ES res si es necesario, O E | | 


ARO e 


La cuestión es que una base es un conjunto independiente maximal. No puede hacerse 
más grande sin perder independencia. Una base también es un conjunto independiente mi- 
nimal. No es posible hacerlo más pequeño y seguir generando el espacio. 

El lector debe observar que el término “dimensional” se utiliza en dos sentidos diferen- 
tes. Se habla sobre un vector tetradimensional, haciendo referencia a un vector que está en 
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R*, Ahora se ha definido un subespacio tetradimensional; un ejemplo es el conjunto de 
vectores que están en Ré cuyas componentes primera y última son cero. Los elementos de 
este subespacio tetradimensional son vectores hexadimensionales como (0, 5, 1, 3, 4, 0). 


Una nota final sobre el lenguaje que se utiliza en álgebra lineal. Nunca se utilizan ex- 


9 £ 


presiones como “la base de una matriz”, “rango de un espacio” o “dimensión de una base”. 
Estas frases carecen de sentido. Es la dimensión del espacio columna lo que es igual al ran- 
go de una matriz, como se demostrará en la siguiente sección. 


Conjunto de problemas 2.3 


Los problemas 1 a 10 son sobre independencia, y dependencia lineal. 


1. 


Demestre que vy, vz, V¿ son independientes pero que v;, Yz, Vz, VA¿SOn dependientes: 


1 1 1 2 
1 0 e e 1 e 1 Ya Sul 
0 0 1 4 
Resuelva c,V, + *** + CqUa4 = Do bien Ac = O. Las vs van en las colurmnas de Á. 


Encuentre el mayor número posible de vectores independientes entre los siguientes: 


1 1 1 0 0 0 
A se A o a DAS 1 
0 0 a 0 ml el 
Este número es la del espacio generado por las us. 





Demuestre que si a = 0,d = 0 o bien f = 0 (3 casos), entonces las columnas de U son 
dependientes: 


O - A 
U=l1l0 d e 
0.0 f 


Si a, d, fen el problema 3 son todos distintos de cero, demuestre que la única solución 
de Ux = 0 es x = 0. Así, las columnas de U son independientes. 

Decida la dependencia o independencia de 

a) Los vectores (1, 3,2), (2, 1,3), y (6, 2,1). 

DJ LOs vectores (Lo) 2) (2 20) Vil, dl): 


Escoja tres columnas independientes de U. Luego elija otras dos. Haga lo mismo pa- 
ra A. ¿Encontró bases para estos espacios? 


2.34 1 2.341 
VO) só 1050 A E 
a e A o 
0050 A ea 


Si w;, Wa, w3 son vectores independientes, demuestre que las diferencias v; = wz — 
Uz, Uy = Wj — Waz, Y U3 = w, — wason dependientes. Encuentre una combinación de 
las vs que dé cero. 


Si w;, 2, w3 son vectores independientes, demuestre que las sumas v, = w), + wa, 
Va = W; + Wy, Y Y = Y; + ua son independientes. (Escriba CU, + C7U7 + (303 = 
O en términos de las ws. Encuentre, y resuelva ecuaciones para las cs.) 





10. 
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Suponga que v;, U>, Uz Y Y¿ SON Vectores en R?. 

a) Estos cuatro vectores son dependientes porque _____ 
b) Los dos vectores v;, y v, son dependientes porque 
c) Los vectores vu; y (0, O, 0) son dependientes porque ___ 





Encuentre dos vectores independientes en el plano x + 2y — 3z — += O en R”. Lue- 
go encuentre tres vectores independientes. ¿Por qué no cuatro? ¿De cuál matriz es és- 
te el espacio nulo? 


Los problemas 11 a 18 son sobre el espacio generado por un conjunto de vectores. 
Considere todas las combinaciones lineales de los vectores. 


1. 


12 


13, 


14. 


LS: 


16. 


EZ. 


Describa el subespacio de R* (¿es una recta, un plano o R*?) generado por 
dd) Eos Vectores tt. Ll. =D A LSD. 

b) Los vectores (0, 1, 1) y (1, 1, 0) y (0, O, 0). 

c) Las columnas de una matriz escalonada de 3 por 3 con 2 pivotes. 

d) Todos los vectores con componentes positivas. 


El vector b está en el subespacio generado por las columnas de A cuando hay una so- 
lución de . El vector c está en el espacio renglón de A cuando hay una solución 
de _____.¿Falso o verdadero?: Si el vector cero está en el as renglón, los renglo- 
nes son dependientes. 





Encuentre las dimensiones de 
a) El espacio columna de A, 
b) El espacio columna de (), 
c) El espacio renglón de A, 
d) El espacio renglón de U. 


¿Cuáles de estos dos espacios son iguales? 


A 1.1.0 
A=|1 3 1 SR 002 
o | DIO nO 


Escoja x = (X,, X2, X3, xa) en R*. Tiene 24 reordenamientos como (%2, X1, X3, Xa) y (Ca, 
X3, X1, X2). Estos 24 vectores, incluyendo x mismo, generan un subespacio $. Encuen- 
tre vectores específicos x de modo que la dimensión de $ sea: a) O, b) 1, c) 3, d) 4. 


v + wyuv-— wson combinaciones de y y w. Escriba v y w como combinaciones de 
v + w y uv — w. Los dos pares de vectores el mismo espacio. ¿Cuándo constitu- 
yen una base para el mismo espacio? 





Establezca si los siguientes vectores son o no linealmente independientes, resolvien- 
do C¡U; == C2UV2 E C3U3 + C4UVa = O: 


1 1 0 0 
1 E 0 e 
a ol Us ¡Ae Y3 = ip e Ol 
0 0 1 1 
También decida si generan R*, intentando resolver c,v, + «++ + CqVa = (0, O, O, 1). 


Suponga que los vectores cuya independencia habrá de comprobarse se escriben en los 
renglones, en vez de en las columnas de A. ¿Cómo decide el proceso de eliminación 
de A a U si los vectores son o no independientes? 
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Para decidir si b está en el subespacio generado por w;,... , W,, considere que los vec- 
tores w son las columnas de 4, e intente resolver Ax = b. ¿Cuál es el resultado para 
a) w, = (1, 1,0), w, = (2, 2, 1), w3 = (0, 0, 2), b = (3, 4, 5)? 

bw, = (1, 2,0), w>, = (Q, 5, 0), wz = (0, 0, 2), wa = (0, O, 0), y cualquier b? 


Los problemas 19 a 37 son sobre los requerimientos para una base. 


19. 


20. 


21. 


22, 


23, 


24. 


26. 


PER 


. Suponga que las columnas de una matriz invertible A de 5 por 5 son una base de R?. 


Si v;, - . ., Y, son linealmente independientes, el espacio que generan tiene dimensión 
. Estos vectores son una para ese espacio. Si los vectores son las columnas 
de cualquier matriz de m por n, entonces m es que n. 





Encuentre una base para cada uno de los siguientes subespacios de R(: 

a) Todos los vectores cuyas componentes son iguales. 

b) Todos los vectores tales que la suma de sus componentes es cero, 

c) Todos los vectores perpendiculares a (1, 1, O, 0) y (1, 0, 1, 1). 

d) El espacio columna (en R*) y el espacio nulo (en R?) de U = 1 o a 


Encuentre tres bases distintas para el espacio columna de la matriz U anterior. Luego 

encuentre dos bases distintas para el espacio renglón de U. 

Suponga que Uy, Uz, . . ., V¿ SON seis vectores en R”. 

a) Estos vectores (generan)(no generan)(podrían. generar) R”. 

b) Estos vectores (sonMno son)(podrían ser) linealmente independientes. 

c) Cuatro cualesquiera de esos vectores (sonX(no sonXpodrían ser) una base de R*. 

d) Si esos vectores son las columnas de A, entonces Ax = b (tienelXíno tiene M(podría 
tener) una solución. 


Las columnas de A son n vectores de R”. Si son linealmente independientes, ¿cuál es 
el rango de A? Si generan R”, ¿cuál es el rango? Si son una base de R”, entonces ¿qué 
ocurre? 


Encuentre una base del plano x — 2y + 3z = 0 en R”. Luego encuentre una base pa- 
ra la intersección de ese plano con el plano xy. Luego encuentre una base de todos los 
vectores perpendiculares al plano. 


a) La ecuación Ax = O sólo tiene la solución x = O porque : 
b) Si b está en R”, entonces Ax = b es resoluble porque 


Conclusión: A es invertible. Su rango es 5. 


Suponga que S es un subespacio pentadimensional de R*. ¿Falso o verdadero? 
a) Toda base de $ puede extenderse a una base de R* sumando un vector más. 
b) Toda base de R? puede reducirse a una base de S quitando un vector. 


U se obtuvo a partir de A restando el renglón 1 del renglón 3: 


E SL 
4A=|0 1 1 y U=l0 1 1] 
1.3 060.0 


Encuentre bases de los dos espacios columna. Encuentre bases de los dos espacios ren- 
glón. Encuentre bases de los dos espacios nulos. 





28. 


29. 
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¿Falso o verdadero? (proporcione una razón aceptable). 

a) Sí las columnas de una matriz son dependientes, también lo son los renglones. 

b) El espacio columna de una matriz de 2 por 2 es el mismo que su espacio renglón. 

c) El espacio columna de una matriz de 2 por 2 tiene la misma dimensión que su es- 
pacio renglón. 

d) Las columnas de una matriz son una base para el espacio columna, 


¿Para cuáles números c y d el rango de las siguientes matrices es 2? 


Ly A MS du 
A =10 0:02. 2 y B= d e 
AO Dedo 2 
30. Localice los pivotes, para encontrar una base del espacio columna de 

0.5.4 3 
OS ON 
e OCIO PRONO 
00-30 59:0 


31. 


32. 


JR 


34, 


IS. 


36. 


Se 


Exprese cada columna que no está en la base como una combinación de las columnas 
de la base. También encuentre una matriz A con esta forma escalonada U, pero cuyo 
espacio columna sea diferente. 


Encuentre un contraejemplo de la siguiente afirmación: Si v,, Vaz, Vz, Va €s una base 
del espacio vectorial R?, y si W es un subespacio, entonces algún subconjunto de las 
vs es una base de W. 


Encuentre las dimensiones de los siguientes espacios vectoriales: 

a) El espacio de todos los vectores en R* tales que la suma de sus componentes es cero. 
b) El espacio nulo de la matriz identidad de 4 por 4. 

c) El espacio de todas las matrices de 4 por 4. 


Suponga que se sabe que la dimensión de V es k. Demuestre que 
a) cualesquiera k vectores independientes en V son una base; 
b) cualesquiera k vectores que generan Y son una base, 


En otras palabras, si se sabe que el número de vectores es correcto, entonces una de las 
dos propiedades de una base implica a la segunda. 

Demuestre que si V y W son subespacios vectoriales tridimensionales de R”, entonces 
V y W deben tener en común un vector diferente de cero. Sugerencia: Empiece con ba- 
ses de los dos subespacios, formando seis vectores en total. 


¿Falso o verdadero? 


a) Si las columnas de A son linealmente independientes, entonces Ax = b tiene exac- 
tamente una solución para toda b. 
bj) Una matriz de 5 por 7 nunca tiene columnas linealmente independientes. 


Si A es una matriz de 64 por 17 con rango 11, ¿cuántos vectores independientes cum- 
plen Ax = 0? ¿cuántos vectores independientes cumplen 4* y = 0? 


Encuentre una base de cada uno de los siguientes subespacios de matrices de 3 por 3: 
a) Todas las matrices diagonales. 

b) Todas las matrices simétricas (4* = A). 

c) Todas las matrices sesgadas simétricas (4* = —A). 
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Los problemas 38 a 42 son sobre espacios en los que los “vectores” son funciones. 
38. a) Encuentre todas las funciones que cumplen Y =0. 


bj) Encuentre una función particular que cumpla > =3, 


c) Encuentre todas las funciones que cumplen 5 = 3, 


39. El espacio coseno Fx contiene todas las combinaciones y(x) = A cos x + B cos 2x + 
C cos 3x. Encuentre una base del subespacio que cumple y(0) = O. 


40. Encuentre una base para el espacio de las funciones que cumplen lo siguiente: 


dy 

0 
2) ax a 

AY Y 
b — -2 =0, 
a Xx 


41. Suponga que y¡G0), y2G0), y300) son tres funciones distintas de x. El espacio vectorial 
que pueden generar tiene dimensión 1, 2, 3. Proporcione un ejemplo de yy, y2, y3 que 
muestre cada posibilidad. 


42. Encuentre una base para el espacio de los polinomios p(x) de grado <= 3. Encuentre 
una base para el subespacio de p(1) = O. 


43. ¡Escriba la matriz identidad de 3 por 3 como una combinación de las otras cinco ma- 
trices permutación! Luego demuestre que estas cinco matrices son linealmente inde- 
pendientes. (Suponga que una combinación proporciona cero, y verifique los elementos 
para probar que cada término es cero.) Las cinco permutaciones son una base del su- 
bespacio de matrices de 3 por 3 cuyas sumas de renglones y colunmmas es igual. 


44. Repaso: ¿En cuáles de los siguientes incisos se muestran bases de R*? 


a) (1,2,0) y (0,1,—1). 

b (1,1,—D,2, 3,9),(4, 1, —D,(0, 1, —1). 
e) (1,2,2),(—1, 2, 1),(0, 8, 0). 

d (1,22,(1,2.D.00, 8,6). 


45. Repaso: Suponga que A es de 3 por 4 con rango 4. Demuestre que Ax = b no tiene so- 
lución cuando la matriz [A b] de 5 por 5 es invertible. Demuestre que Ax = bes reso- 
luble cuando (A b] es singular. 








2.4 LOS CUATRO SUBESPACIOS FUNDAMENTALES 


La sección anterior se centró más en definiciones que en construcciones. Se sabe lo que es 
una base, pero no cómo encontrar una. Ahora, empezando con una descripción explícita de 
un subespacio, sería conveniente calcular una base explícita. 

Los subespacios pueden describirse en dos formas. Primero, puede proporcionarse un 
subconjunto de vectores que generan el espacio. (Ejemplo: Las columnas generan el es- 
pacio columna.) Segundo, pueden especificarse las condiciones que deben cumplir los 
vectores en el espacio. (Ejemplo: El espacio nulo consta de todos los vectores que cum- 
plen Ax = 0.) 

La primera descripción puede incluir vectores inútiles (columnas dependientes). La se- 
gunda descripción puede incluir condiciones repetidas (renglones dependientes). No es po- 
sible escribir una base por inspección, de modo que se requiere un procedimiento 
sistemático. 
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El lector puede adivinar cuál debe ser el procedimiento. Cuando la eliminación sobre 
Á produce una matriz escalonada U o una reducida R, para cada uno de los subespacios aso- 
ciados con Á se encuentra una base. Luego tiene que considerarse el caso extremo de ran- 
go total: 


Cuando el rango es lo más grande posible, r =nor=mor =m = n, la matriz tie- 





ne una inversa izquierda B, o una inversa derecha C o una A” * por ambos lados. 


Con la finalidad de organizar todo el análisis, cada uno de los cuatro subespacios se abor- 


dará a su vez. Dos de ellos son conocidos y dos son nuevos. 
Y 


1. El espacio columna de A se denota por C(4). Su dimensión es el rango r. 

2. Elespacio nulo de A se denota por N(A). Su dimensión es n — r. 

3. El espacio renglón de A es el espacio columna de A*. Es C(A*), y es generado por los 
renglones de A, Su dimensión también es r. 

4. Elespacio nulo izquierdo de A es el espacio nulo de A”. Contiene a todos los vecto- 
res y, tales que AFy = O, y se escribe N(AP). Su dimensión es l 





La cuestión sobre los dos últimos subespacios es que provienen de A*. Si A es una ma- 
triz de m por n, es posible ver cuáles espacios “huéspedes” contienen a los cuatro subespa- 
cios, al observar el número de componentes: 






El espacio nulo N(4) y el espacio renglón C(A*) son subespacios de R”., 
El espacio nulo izquierdo N(A*) y el espacio columna C(4) son subespacios de R”. 





Los renglones tienen n componentes y las columnas tienen m. Para una matriz sencilla 
como 


A=U=R=| 0 Al 


00 


el espacio columna es la recta que pasa por Ln . El espacio renglón es la recta que pasa por 


[1 0 0]7. Está en R*. El espacio nulo es un plano en R* y el espacio nulo izquierdo es una 
recta en R?: 
0 0 0 
N(A) contiene [1] y |0Í, N(AP) contiene H 
0 1 


Observe que todos los vectores son vectores columna. Incluso los renglones están traspues- 
tos, y el espacio renglón de A es el espacio columna de A*. Nuestro problema es relacionar 
los cuatro espacios para U (después de la eliminación) con los cuatro espacios para Á: 


: y ES ES AE 1 a e 2) 

E j 

NO á U=410 0.3.9 proviene de A=| 2 6 9 71]. 
0.0.0.0 E. 


Como novedad, los cuatro espacios se considerarán en un orden más interesante. 


3. El espacio renglón de A Para cada matriz escalonada como U, el espacio renglón es evi- 
dente. Contiene a todas las combinaciones de los renglones, como ocurre con cualquier es- 
pacio renglón, aunque aquí el tercer renglón no contribuye a nada. Los dos primeros 
renglones son una base del espacio renglón. Una regla semejante es válida para toda ma- 
triz escalonada U o R, con r pivotes y r renglones diferentes de cero: los renglones dife- 
rentes de cero son una base, y la dimensión del espacio renglón es r. Esto facilita tratar 
con la matriz original A. 
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La razón es que cada operación elemental deja sin cambio el espacio renglón. Los renglo- 
nes en U son combinaciones de los renglones originales en A. En consecuencia, el espacio 
renglón de U no contiene nada nuevo. Al mismo tiempo, debido a que cada paso puede in- 
vertirse, nada se pierde; los renglones de A pueden recuperarse de U. Es cierto que los ren- 
glones de A y U son distintos, pero las combinaciones de los renglones son idénticas: 
¡mismo espacio! 

Observe que no se empezó con los m renglones de A, que generan el espacio renglón, 
y que se eliminan m — r de ellos para terminar con una base. Según 2L, hubiera podido ha- 
cerse lo anterior. Sin embargo, podría ser difícil decidir cuáles renglones preservar, y cuá- 
les eliminar, por lo que fue más fácil considerar los renglones de U diferentes de cero. 


2. El espacio nulo de A La eliminación simplifica un sistema de ecuaciones lineales 
sin cambiar las soluciones. El sistema Ax = O se reduce al sistema Ux = 0, y este proceso 
es reversible. El espacio nulo de A es el mismo que el espacio nulo de U y R. Sólo r de 
las ecuaciones Ax = b son independientes. Al elegir las n — r “soluciones especiales” 
de Ax = O se obtiene una base definida da el ca nulo: 


Es 2. 1 Siiensión del espacio. hi Na): es A Fs Las LE EOS especiales” son | 
p “una base: á cada variable libre se asigna el valor t “mientras las otras variables libres E 
Son! O: Así, Ax= y o. Un = = ¿0 o RA =.0 O proporcionan 1 las variables Piyete, BES sustitu- 
E ción hacia atrás. di 3 a ] 


Ésta es exactamente la forma en que se ha venido resolviendo Ux = 0. El ejemplo básico 
anterior tiene pivotes en las columnas 1 y 3. En consecuencia, sus variables libres son las 
columnas segunda y cuarta, y y y. La base del espacio nulo es 


=>) 1 
y=] 1 v=0 0 

Soluciones especiales x = , x= 
y =0 Ó y =1 : 


Cualquier combinación c,x, + €zx, tiene a c, en su componente y, y a c, en su componen- 
te y. La única forma en que c,x, + c7x, = O es que c; = cz = 0, de modo que estos vec- 
tores son independientes. También generan el espacio nulo; la solución completa es ux, + 
yx». Así, los n — r = 4 — 2 vectores son una base. 

El espacio nulo también se denomina kermel de A, y su dimensión n — res la nulidad. 


1. El espacio colurana de A El espacio columna a veces se denomina rango. Esto es 
consistente con la idea de costumbre que se tiene respecto del contradominio como el con- 
junto de todos los valores posibles f(x); x está en el dominio y f(x) está en el contradomi- 
nio. En nuestro caso, la función es f(x) = Ax. Su dominio consta de todas las x en R”; su 
contradominio consta de todos los vectores posibles Ax, que es el espacio columna. (En una 
edición previa a ésta se denominó R(A). 

El problema consiste en encontrar base para los espacios columna de U y A. Estos es- 
pacios son distintos (¡simplemente observe las matrices!) aunque su dimensión es la misma. 

Las columnas primera y tercera de U son una base de su espacio columna. Se trata 
de las columnas que contienen a los pivotes. Cualquier otra columna es una combinación de 
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estas dos. Además, lo mismo es cierto para la A original; aun cuando sus columnas son di- 
ferentes. Las columnas pivote de A son una base de su espacio columna. La segunda co- 
lumna es tres veces la primera, justo como en U. La cuarta columna es igual a (columna 3) 
— (columna 1). El mismo espacio nulo indica estas dependencias. 

Lo anterior se debe a que Ax = O exactamente cuando Ux = 0. Los dos sistemas son 
equivalentes y tienen las mismas soluciones. La cuarta columna de U también era (colum- 
na 3) — (columna 1). Toda dependencia lineal Ax = O entre las columnas de A es compen- 
sada por una dependencia Ux = 0 entre las columnas de U, con exactamente los mismos 
coeficientes. Si sn conjunto de columnas de A es independiente, entonces también lo son 
las columnas correspondientes de U, y viceversa. 

Con la finalidad de encontrar una base del espacio columna C(A4), se usa lo que ya se 
ha hecho para U. Las r columnas que contienen a los pivotes son una base del espacio co- 
lurmana de YU. Estas mismas r columnas se dado en A: 






: 20. LS Da ñéntioa dele espacio Art ¿Ce es plo E rango 7 r, - que NN ES e elal pe 
La ala dimensión del espacio. renglón: El. número. de ¿ohepnes al es O £ 


«e EA 


El E ER AGO y el fe E columna tienen la misma dimensión r! Este es uno de 
los teoremas más importantes en álgebra lineal. A menudo se abrevia como “rango de los 
renglones = rango de las columnas”. Expresa un resultado que, para una matriz aleatoria 
de 10 por 12 no es para nada evidente. También dice algo sobre las matrices cuadradas: Si 
los renglones de una matriz cuadrada son linealmente independientes, entonces también lo 
son las columnas (y viceversa). De nuevo, esto no parece autoevidente (por lo menos, no 
para el autor). 

Para ver otra vez que la dimensión del espacio columna y del espacio renglón de U es 
r, considere una situación típica con rango r = 3. La matriz escalonada U ciertamente tie- 
ne tres renglones independientes: 


a 


, 
DO 
O Ox 
DO0OO%x 

S 
OOIx x 
Dx x 


O 


* 


U = 0 
0 


¡a 


Se afirma que U también tiene tres columnas independientes y no más que tres. Estas colum- 
nas sólo tienen tres componentes diferentes de cero. Si puede demostrarse que las columnas 
pivote: la primera, la cuarta, y la sexta, son linealmente independientes, entonces debe haber 
una base (¡para el espacio columna de U, no el de A!) Suponga que una combinación de es- 
tas columnas pivote produjo cero: 


dy AE ES 0 
0 da ES e 0 
Ci 0 35.05 0 E C3 d; = 0 
0 0 0 0 


Trabajando hacia arriba como de costumbre, cz debe ser cero porque el pivote dz * 0; así, 
c, debe ser cero porque el pivote d, + 0; y finalmente c, = O. Con esto se establece la in- 
dependencia y se completa la demostración. Como Ax = O si y sólo si Ux = 0, las colum- 
nas primera, cuarta y sexta de A, sin importar cuál era la matriz original A, que ni siquiera 
se conoció en este ejemplo, son una base de C(4). 





106 Capítulo 2 Espacios vectoriales 


El espacio columna y el espacio renglón se vuelven evidentes después de la elimina- 
ción sobre 4. A continuación se abordará el cuarto subespacio fundamental, que se ha man- 
tenido silenciosamente fuera de la vista. Debido a que los tres primeros espacios eran C(A), 
N(A) y C(A?), el cuarto espacio debe ser N(A5). Es el espacio nulo de la traspuesta, o el es- 
pacio nulo izquierdo de A. A*y = O significa que y!A = O, y el vector aparece en el miem- 
bro izquierdo de A. 


4. El espacio nulo izquierdo de A (= espacio nulo de A*) Si A es una matriz de m por 
n, entonces A* es de n por m. Su ao nulo es un subespacio de R”; el vector y tiene m 
componentes. Si se escribe como yA = 0, estas componentes multiplican los renglones de 
A para producir el renglón cero: 





yYA= [+ ym]j A |=[0---0]. 


La dimensión de este espacio nulo N(A?) es fácil de encontrar. Para cualquier matriz, 
el número de variables pivote más el número de variables libres debe corresponder al nú- 
mero total de columnas. Para A, era r + (n — r) = n. En otras palabras, el rango más las 
nulidades igual a n: 


dimensión de C(A) + dimensión de N(A) = número de columnas. 


Esta ley se aplica igualmente a A*, que tiene m columnas. A* es tan buena matriz como A. 
Pero la dimensión de su espacio columna también es r, de modo que 


r + dimensión (N(AB) = m. (1) 


se 





Las m — r soluciones de y'A = 0 se esconden en alguna parte durante la eliminación. 
Los renglones de A se combinan para producir los m — r renglones cero de U. Se empieza 
con PA = LU, o con L”*PA = U. Los últimos m — r renglones de la matriz invertible L”*P 
deben ser una base de las ys en el espacio nulo izquierdo, ya que multiplican a A para pro- 
ducir los renglones cero en U. 

En el ejemplo de 3 por 4, el renglón cero era el renglón 3 — 2(renglón 2) + S(renglón 
1). En consecuencia, las componentes de y son 5, —2, 1. Esta es la misma combinación que 
en b3 — 2b, + 5b, en el miembro derecho, lo cual lleva a O = O como la ecuación final. 
Ese vector y es una base para el espacio nulo izquierdo, cuya dimensión es m — r = 3 — 
2 = 1. Es el último renglón de L”*P, y produce el renglón cero en U, y a menudo puede 
verse sin necesidad de calcular L”*. Cuando se está desesperado, siempre es posible resol- 
ver precisamente ATy = 0. 

Me doy cuenta de que hasta el momento, en este libro, no se ha proporcionado ningu- 
na razón para tener cuidado sobre N(A*). Es correcto pero no convincente si en cursivas se 
escribe que el espacio nulo izquierdo siempre es importante. En la siguiente sección se me- 
jora el tema de encontrar un significado físico para y, a partir de la ley de la corriente de 
Kirchhoff. 

Ahora ya se conocen las dimensiones de los cuatro espacios. Pueden resumirse en una 
tabla, y aún así falta mucho e poder indicarlas como el 


$ Teorema f fundamental del 2 álgebra li lineal, | al, parte 





E 1h “Ca): = - espacio columna de A: dimensión 
E 2. NA) - = = espacio nulo de. 3 dimensión | n 
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Ejemplo 1 





1. El espacio columna contiene a todos los múltiplos de 5 La segunda columna está 
en la misma dirección y no contribuye con nada nuevo. 


2. Elespacio nulo contiene a todos los múltiplos de iS Este vector satisface Ax = O. 


3. El espacio renglón contiene a todos los múltiplos de 15]. Lo escribo como un vector 
columna porque, hablando estrictamente, está en el espacio columna de A 
4. El espacio nulo izquierdo contiene a todos los múltiplos de y = e ! La suma de los 


renglones de A con coeficientes —3 y 1 es cero, de modo que A*y = O, 
En este ejemplo todos los cuatro subespacios son rectas. Esto es accidental, y proviene de 
r=1yn=r=lym-r= 1. En la figura 2.5 se muestra que dos pares de rectas son 
perpendiculares. ¡Esto no es accidental! 









espacio columna 
C(A) | 
múltiplos de (1, 3) 


espacio nulo IV(47) 
múltiplos de (3, —1) 





múltiplos de (1, 2) T múltiplos de (2, —1) E 3 | 


Figura 2.5 Los cuatro subespacios fundamentales (rectas) de la matriz singular A. 


Si el último elemento de A se cambia de 6 a 7, todas las dimensiones son diferentes. 
La dimensión del espacio columna y el espacio renglón es r = 2. El espacio nulo y el es- 
pacio nulo izquierdo sólo contienen a los vectores x = O y y = 0. La matriz es invertible. 


Existencia de inversas 


Se sabe que si A tiene una inversa izquierda (BA = )) y una inversa derecha (AC = J/), en- 
tonces las dos inversas son 1guales: B = B(AC) = (BA)C = C. Así, por el rango de una 
matriz, es fácil decidir cuáles matrices tienen en realidad estas inversas. En términos gene- 
rales, una inversa existe sólo cuando el rango es lo más grande posible. 

El rango siempre cumple r < m y también r <= n. Una matriz de m por n no puede 
tener más de m renglones independientes o n columnas independientes. No hay espacio pa- 
ra más de m pivotes, o más de n. Se quiere demostrar que cuando r = m hay una inversa de- 
recha, y que Ax = b siempre tiene una solución única. Cuando r = n, hay una inversa 
izquierda y la solución (sí existe) es Única. 

Sólo una matriz cuadrada puede tener ambos r = m y r = n, y en consecuencia sólo 
una matriz cuadrada puede tener existencia y unicidad. Sólo una matriz cuadrada tiene una 
inversa por ambos lados. 
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Ejemplo 2 





| Le eo e total r. 





En el caso de existencia, una solución posible es x = Cb, ya que entonces Ax = 
ACb = b. Sin embargo, hay otras soluciones si hay otras inversas derechas. El número de 
soluciones cuando las columnas generan R” es 10 00. 

En el caso de unicidad, si hay una solución de Ax = b, debe ser x = BAx = Bb. Pero 
puede no haber solución. El número de soluciones es Q o 1. 

Hay fórmulas sencillas para encontrar las mejores inversas izquierda y derecha, en ca- 
so de existir: 


Inversas por unlado  B=(ATATUAP y C= AAA), 


Ciertamente BA = ] y AC = 1. Lo que no es tan cierto es que ATA y AA” son realmente in- 
vertibles. En el capítulo 3 se demostrará que ATA tiene inversa si el rango es n, y AA” tie- 
ne inversa cuando el rango es m. Así, las fórmulas tienen sentido exactamente cuando el 
rango es lo más grande posible, y se encuentran las inversas por un lado. 


Considere una matriz sencilla de 2 por 3 con rango 2: 
A SO 30) 
iS E 5 a 


Debido a que r = m = 2, el teorema garantiza una inversa derecha C: 


L 0 
40 0714 1.0 

= 14d = 
ac=[é 5 ojo 3 Ed 


C3  C32 
Hay muchas inversas derechas porque el último renglón de C es completamente arbitrario. 
Este es un caso de existencia pero no de unicidad. La matriz A no tiene inversa izquierda 
porque la última columna de BA es ciertamente cero. La inversa derecha específica C = 
AXAAD)”? elige que cz, y C3, Sean cero: 


4 0 dp 7 y 
La mejor inversa derecha ACAADOS == 10005 .S ¿|=]/0 53/=C. 
o 011% 3 ARE 


Esta es la seudoinversa: una forma de escoger la mejor C en la sección 6.3. La traspuesta 
de A, lleva a un ejemplo de una infinidad de inversas izquierdas: 

A 

13 
BAr=|p? 0, 0 5 = 1, E 

03 ?allo o 
Ahora, la que es completamente arbitraria es la última columna de B. La mejor inversa iz- 
quierda (también la seudoinversa) tiene b,3 = ba3 = O. Este es un “caso de unicidad”, cuan- 
do el rango es r = n. 
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No hay variables libres, ya que n — r = 0. Si existe una solución, es única. El lector pue- 
de ver cuándo este ejemplo tiene una solución o no tiene solución. 


4 0 by 
0073 al = |b2]| es resoluble exactamente cuando b3 =0, 
Does ba 


Una matriz rectangular no puede tener tanto existencia como unicidad. Si m es diferente de 
n, entonces no puede cumplirse r =myr=m.' 

Una matriz cuadrada constituye el caso opuesto. Sim = n, no puede cumplirse una pro- 
piedad sin la otra. Una matriz cuadrada tiene una inversa izquierda si y sólo si tiene una 
inversa derecha. Sólo hay una inversa; a saber, B = C = A”?, Cuando la matriz es cuadra- 
da, la existencia implica la unicidad y la unicidad implica la existencia. La condición para 
invertibilidad es el rango total: r = m = n. Cada una de las siguientes condiciones es una 
prueba necesaria y suficiente: 


1. Las columnas generan R”, de modo que Ax = b tiene por lo menos una solución para 
toda b. 
2. Las columnas son independientes, de modo que Ax = O sólo tiene la solución x = O. 


Esta lista puede hacerse mucho más grande, especialmente si se piensa en los capítulos ul- 
teriores. Cada condición es equivalente a cualquier otra, lo cual asegura que A es invertible. 


3. Los renglones de A generan R”. 

4. Los renglones son linealmente independientes. 

5. Es posible completar la eliminación: PA = LDU, con todos los n pivotes. 
6. El determinante de A es diferente de cero. 

7.  Elcero no es un valor característico de A. 

8. ATA es positiva definida. 

A continuación se presenta una aplicación típica a polinomios P(+t) de grado n — 1. El 
único de estos polinomios que se hace cero en t,, ..., 1, €s P(t) = 0. Ningún otro polino- 
mio de grado n — 1 puede tener n raíces. Esto es unicidad, e implica existencia: Dados va- 
lores cualesquiera b,, . .., b,, existe un polinomio de grado n — 1 que interpola estos 
valores: P(t;) = b;. La cuestión es que está tratando con una matriz cuadrada; el número n 
de coeficientes en P(É) =x, + xt + c+ xp? corresponde al número de ecuaciones: 

EE E ó ... 0d X1 by 

Interpolación DE x2| [02 
P(ti) = bi E: : 
1 dd dd As e Xn Da 


Esta matriz de Vandermonde es de n por n y con rango total. Ax = b siempre tiene una so- 
lución: un polinomio puede pasar por cualquier b, en puntos distintos £,. Después se encon- 
trará realmente el determinante de A; no es cero. 


Matrices de rango 1 


Por último llega el caso más sencillo, cuando el rango es lo más pequeño posible (excepto 
por la matriz cero con rango 0). Uno de los temas básicos de las matemáticas es, dado algo 


ASTILA 
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complicado, demostrar cómo puede descomponerse en piezas sencillas. Para el álgebra li- 
neal, las piezas sencillas son las matrices de rango 1. 


Z 1 1 
e 4 2 o E A 
Rango 1l A= 8 4 4 | úene r= Es 
A 


Cada renglón es un múltiplo del primer renglón, de modo que el espacio renglón es unidi- 
mensional. De hecho es posible escribir toda la matriz como el producto de un vector co- 
lumna y un vector renglón: 


2 AA 0 OS 
A = (columna) (renglón) . ; ; = A 
a a =. 


El producto de una matriz de 4 por 1 y una matriz de 1 por 3 es una matriz de 4 por 3. El 
rango de este producto es 1. Al mismo tiempo, las columnas son todos los múltiplos del 
mismo vector columna; el espacio columna comparte la dimensión r = 1, y se reduce a una 
recta, 


Toda matriz con rango 1 tiene la forma sencilla A = uv* = columna por renglón. 


Todos los renglones son múltiplos del mismo vector v*, y todas las columnas son múlti- 
plos de u. El espacio renglón y el espacio columna son rectas: el caso más sencillo. 


Conjunto de problemas 2.4 


1. Falso o verdadero: Sim = n, entonces el espacio renglón de A es igual al espacio co- 
lumna. Si m < n, entonces el espacio nulo tiene una dimensión mayor que 





2. Encuentre la dimensión, y construya una base para los cuatro subespacios asociados 
con cada una de las siguientes matrices 


AO: O LO o O 
ka y e 
3, Encuentre la dimensión y una base para los cuatro subespacios fundamentales de 
ESZO A E 200 
A=|0 1 1 0 y US DOE E 007 
O y O! 0000 


4. Describa los cuatro subespacios en el espacio tridimensional asociados con 


O. ¿E 50 
A=|0 O 1 
000.0 


5.  Siel producto AB es la matriz cero, AB = 0, demuestre que el espacio columna aso- 
ciado de B está contenido en el espacio nulo de A. (También, el espacio renglón de A 
está en el espacio nulo izquierdo de B, ya que cada renglón de A multiplica B para ob- 
tener un renglón cero.) 
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6. Suponga que A es cualquier matriz de m por n de rango r. ¿En qué condiciones sobre 
estos números 


a) A tiene una inversa por ambos lados: AA”? = ATA = 7? 
D) Ax = b tiene una infinidad de soluciones para toda b? 


7. ¿Por qué no existe ninguna matriz cero cuyos espacios renglón y nulo contengan a (1, 
E 


S. Suponga que la única solución de Ax = O (nm ecuaciones en n incógnitas) es x = O. 
¿Cuál es el rango y por qué? Las columnas de A son linealmente : 


9. Encuentre una matriz de 1 por 3 cuyo espacio nulo conste de todos los vectores en R* 
tales que x, + 2x, + 4x3 = 0. Encuentre una matriz de 3 por 3 con el mismo espacio 
nulo. 


10. Si Ax = b siempre tiene por lo menos una solución, demuestre que la única solución 
de A%y = 0Oes y = 0. Sugerencia: ¿Cuál es el rango? 


11. Si Ax = 0 tiene una solución diferente de cero, demuestre que ATy = f falla en ser re- 
soluble para algunos miembros derechos f. Construya un ejemplo de A y f. 


12. Encuentre el rango de A, y escriba la matriz como A = uv?: 


o te 
a=|0 0.00 y a= | Be 
20.06 


13. Si se proporcionan a, b, c con a * O, escoja d de modo que el rango de 


e q b ES r 
A= |: A] Uv 


sea 1. ¿Cuáles son los pivotes? 


14. Encuentre una inversa izquierda y/o una inversa derecha (cuando existan) para 


1.0 
A=|) Yi y M=l1 1| y A! 
da 


15. Si las columnas de A son linealmente independientes (A es de m por n), entonces el 
rango es , €l espacio nulo es , y existe una inversa 











16. (Una paradoja) Suponga que A tiene una inversa derecha B. Así, AB = / conduce a 
AYAB = AT oB = (ATA)7!A*. Sin embargo, satisface BA = 1; es una inversa izquier- 
da. ¿Cuál paso no está justificado? 


17. Encuentre una matriz Á cuyo espacio renglón sea V, y una matriz B cuyo espacio nu- 
lo sea V, si Y es el subespacio generado por 


l l 1 


PS e A o E 
0 0 0 
13. Encuentre una base de cada uno de los cuatro subespacios de 


4 1 
A=|019246|=| 1 
O 


oO 0 E 1 
1 
05060, T 2 1 


O 
0 OOO Toa 
1 070-0300 





AA 
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19. 
20. 


21. 


22. 


24, 


23, 


26. 


27. 


28. 


29, 


S1 A tiene los mismos cuatro subespacios fundamentales que B, ¿es cierto que A = cB? 


a) Si el rango de una matriz de 7 por 9 es 5, ¿cuáles son las dimensiones de los cua- 
tro subespacios? ¿Cuánto es la suma de los cuatro subespacios? 

b) Si el rango de una matriz de 3 por 4 es 3, ¿cuáles son el espacio columna y el es- 
pacio nulo izquierdo? 


Construya una matriz con la propiedad requerida, o explique por qué no es posible, 


; ? 1 0 j 1 2 
a) El espacio columna contiene a ] : A , el espacio renglón contiene a A : a 
1 


1 3 
b) El espacio columna tiene como base a Bl , €l espacio nulo tiene como base a | ; 
3 
c) La dimensión del espacio nulo = 1 + dimensión del espacio nulo izquierdo. 
: ER E i 3 
d) El espacio nulo izquierdo contiene a El el espacio renglón contiene a | 4 . 
e) Espacio renglón = espacio columna, espacio nulo + espacio nulo izquierdo. 


Sin eliminación, encuentre las dimensiones y bases de los cuatro subespacios de 


A 1 1 
A=|0 0 0.0 y B=|4 4 
A s 5 


. Suponga que una matriz A de 3 por 3 es invertible. Escriba bases de los cuatro subes- 


pacios de A, y también para la matriz de 3 por 6 B = [A Al. 
¿Cuáles son las dimensiones de los cuatro subespacios de A, B, y C, si l es la matriz 
identidad de 3 por 3, y O es la matriz cero de 3 por 2? 
Sá 
A=[I 0] y B= or or y C=]0)]. 


¿Cuáles subespacios son iguales para las siguientes matrices de tamaños distintos? 


20 A 63 


Demuestre que el rango de estas tres matrices es el mismo: r. 


Si los elementos de una matriz de 3 por 3 se escogen aleatoriamente entre 0 y 1, ¿cuá- 
les son las dimensiones más probables de los cuatro subespacios? ¿Qué ocurre si la 
matriz es de 3 por 5? 


(Importante) A es una matriz de mm por n con rango r. Suponga que hay miembros de- 
rechos b para los cuales Ax = b no tiene solución. 

a) ¡Cuáles desigualdades (< o =) deben ser ciertas entre m, n, y r? 

b) ¿Cómo se sabe que A*y = O tiene una solución diferente de cero? 


Construya una matriz con (1, O, 1) y (1, 2, 0) como una base para su espacio ren- 
glón y su espacio columna. ¿Por qué esta base no puede ser una base del espacio 
renglón y del espacio nulo? 


Sin calcular A, encuentre bases de los cuatro subespacios fundamentales: 


00 E Le de 
A=J6 1 0 0 TLZ2S 
OL 000 4. Z 





E 
: 
7 





30. 


IL: 


EE 


3: 


34, 


$9 


36. 


5 7 
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Si se intercambian los dos primeros renglones de una matriz A, ¿cuáles de los cuatro 
subespacios permanecen igual? Si y = (1, 2, 3, 4) está en el espacio nulo izquierdo de 
A, escriba un vector en el espacio nulo izquierdo de la nueva matriz. 


Explique por qué v = (1, 0, —1) no puede ser un renglón de A y también estar en el 
espacio nulo. 


Describa los cuatro subespacios de R* asociados con 


0 
ln 
1 


o 


0-30 1 

A=|0 0 1 y I+A=j0 

0-00 0 

(Espacio nulo izquierdo) Sume la columna extra b, y reduzca A a forma escalonada: 


1 AS NS + 1 A O 
[A b | =|4 5 6 b> o O 3 —6 b» — Ab, 
7.89 mb 0 0 O  b3—2b +b, 


Una combinación de los renglones de A produjo el renglón cero. ¿Qué combinación 
es? (Observe b3 — 2b, + b, en el miembro derecho.) ¿Cuáles vectores están en el es- 
pacio nulo de A*, y cuáles están en el espacio nulo de 4? 


Siga el método del problema 33 para reducir A a forma escalonada, y busque los ren- 
glones cero. La columna b indica cuáles combinaciones de los renglones se tomaron. 


1 SZe BD 

1.2 b1 A 
a 13 4 bl. a AR AO 

4 6 by; 2050 ba 


A partir de la columna b después de la eliminación, lea m — r vectores de la base en 
el espacio nulo izquierdo de A (combinaciones de renglones que proporcionan cero). 


Suponga que A es la suma de dos matrices de rango 1: A = uv? + wz?, 
a) ¿Cuáles vectores generan el espacio columna de A? 


b) ¿Cuáles vectores generan el espacio renglón de A? 








c) El rango es menos de 2 s1 O si 
d) Calcule A y su rango, siu == (1,0, 0) y v = w= (0, 0, 1). 
Sin multiplicar las matrices, encuentre bases de los espacios renglón y columna de A: 
¡OS 
a=|4 5 E : > 
E 


¿Cómo se sabe a partir de estas formas que A no es invertible? 


¿Falso o verdadero? (Según corresponda, proporcione una razón o un contraejemplo.) 
a) A y A? tienen el mismo número de pivotes. 

b) A y A* tienen el mismo espacio nulo izquierdo. 

c) Si el espacio renglón es igual al espacio columna, entonces A* = A. 

d) S¡A* = —A, entonces el espacio renglón de A es igual al espacio columna. 


.cil 
EA A TAN 
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38. SiAB =0, las columnas de B están en el espacio nulo de A. Si estos vectores están en 
R”, demuestre que rango(4) + rango(B) <= n, 


39. ¿Es posible completar un juego de “gato” (tic-tac-toe) (3 unos y 4 ceros en A) de mo- 
do que rango(A) = 2, pero que en ningún lado se tenga una jugada ganadora? 


40. Construya una matriz de 2 por 3 de rango 1. Copie la figura 2.5, y ponga un vector en 
cada subespacio (dos en el espacio nulo). ¿Cuáles vectores son ortogonales? 


41. Vuelva a dibujar la figura 2.5 para una matriz de 3 por 2 de rango r = 2. ¿Cuál subes- 
pacio es Z (sólo el vector cero)? La parte del espacio nulo de cualquier vector x en R? 
eS X, = 





2.5 GRÁFICAS Y REDES 


No estoy muy contento con la matriz de 3 por 4 en la sección previa. Desde un punto de 
vista teórico, era bastante satisfactoria, los cuatro subespacios eran calculables y sus di- 
mensiones r, 1 — r, r, m — r eran diferentes de cero. Sin embargo, el ejemplo no fue pro- 
ducto de una verdadera aplicación. No mostró cuán fundamentales realmente son estos 
subespacios. 

En esta sección se presenta una clase de matrices rectangulares con dos ventajas. Son 
sencillas y son importantes. Son matrices de incidencia de gráficas, y cada elemento es 1, 
—1,00. Lo extraordinario es que lo mismo es ciertode £, U y vectores de la base para los 
cuatro subespacios. Estos subespacios desempeñan un papel central en la teoría de redes. 
Se recalca que el término “gráfica” no se refiere a la gráfica de una función (como una pa- 
rábola para y = x?). Hay un segundo significado, completamente distinto, más próximo a 
las ciencias de la computación que al cálculo, que es fácil explicar. Esta sección es opcio- 
nal, pero constituye una oportunidad para ver en acción a las matrices rectangulares, así co- 
mo la forma en que la matriz simétrica cuadrada ATA aparece al final. 

Una gráfica consta de un conjunto de vértices o nodos y un conjunto de aristas que 
unen a los nodos. La gráfica de la figura 2.6 tiene 4 nodos y 5 aristas. No tiene una arista 
entre los nodos 1 y 4 (y las aristas de un nodo hacia sí mismo están prohibidas). Esta grá- 
fica es dirigida, debido a la flecha que hay en cada arista. 

La matriz de incidencia arista-nodo es de 5 por 4, con un renglón para cada arista, 
Si la arista va del nodo j al nodo k, entonces ese renglón tiene — 1 en la columna j y +1 
en la columna k. La matriz de incidencia A se muestra junto a la gráfica (aunque también 
podría recuperarse la gráfica si sólo se contara con A). El renglón 1 muestra la arista del 
nodo 1 al nodo 2. El renglón $ proviene de la quinta arista, que va del nodo 3 al nodo 4. 





arista 1 
1 € 2 —1 E 0 0 
—1 0 O $ 
arista 2 | arista 4 Á= o —l 1 0 
| O —1 0 1 
3 E: 0 0-1. 1 
iS nodo 1.2 3 4 


Figura 2.6 Gráfica dirigida (5 aristas, 4 nodos, 2 circuitos) y su matriz de incidencia A. 
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Observe las columnas de A. La columna 3 proporciona información sobre el nodo 3: 
indica qué arista entra y qué arista sale. Las aristas 2 y 3 entran, la arista 5 sale (con el sig- 
no menos). Algunas veces Á se denomina matriz conectividad o matriz topología. Cuando 
la gráfica tiene m aristas y n nodos, A es de m por n (y normalmente m > n), Su traspues- 
ta es la matriz de incidencia “nodo-arista”. 

Cada uno de los cuatro subespacios fundamentales tiene un significado en términos de 
la gráfica. Es posible hacer algo de álgebra lineal, o escribir sobre voltajes y corrientes, 
¡Haremos ambas cosas! 


Espacio nulo de A: ¿Existe una combinación de columnas que proporcione Ax = 0? 
Normalmente, la respuesta se obtiene a partir de la eliminación, aunque aquí viene a pri- 
mera vista. La suma de las columnas es la columna cero. El espacio nulo contiene a x = 
(1, 1, 1, D, ya que Ax = O, La ecuación Ax = b no tiene una solución única (en caso de te- 
ner alguna solución). Cualquier “vector constante” x = (c, c, e, Cc) puede sumarse a cual- 
quier solución particular de Ax = b, La solución completa tiene esta constante arbitraria c 
(como la +C cuando se integra en cálculo). 

Esto tiene un significado sl se piensa que x,, X», x3, X4 son los potenciales (voltajes) 
en los nodos. Las cinco componentes de Ax proporcionan las diferencias de potencial a tra- 
vés de las cinco aristas. La diferencia a través de la arista 1 es x, — xy, proveniente del +1 
en el primer renglón. 

La ecuación Ax = b solicita. Dadas las diferencias b,, ..., bs, encontrar los potencia- 
les verdaderos x;, .. . , X4. ¡Pero esto es imposible de hacer! Todos los potenciales pueden 
aumentarse O disminuirse por la misma constante c, y las diferencias permanecen sin cam- 
bio, lo cual confirma que x = (c, c, c, c) está en el espacio nulo de A. Estos son los únicos 
vectores en el espacio nulo, ya que Ax = O significa igual potencial a través de cada arista. 
El espacio nulo de esta matriz de incidencia es unidimensional. El rango es 4 — 1 = 3, 


Espacio columna: ¿Para cuáles diferencias b,,... , bs es posible resolver Ax = b? Para 
encontrar una prueba directa, considere la matriz, El renglón 1 más el renglón 3 es igual al 
renglón 2. En el miembro derecho se requiere b, + b3 = b,, o ninguna solución es posi- 
ble, De manera semejante, el renglón 3 más el renglón 5 es igual al renglón 4. El miembro 
derecho debe satisfacer b3 + bz = ba, para que la eliminación llegue a O = O. Repitiendo, 
s1 b está en el espacio columna, entonces 


bibi+b3=0 bb bz — ba + bs =0. do) 


Continuando la investigación, también se encuentra que los renglones 1 + 4 son iguales a 
los renglones 2 + 5. Pero esto no es nada nuevo: al restar las ecuaciones en (1) en realidad 
se obtiene b, + b4 = ba + bs. Hay dos condiciones sobre las cinco componentes, ya que 
la dimensión del espacio columna es 3 — 2, Estas condiciones provienen de la eliminación, 
pero aquí tienen un significado sobre la gráfica. 


Circuitos: La ley del voltaje de Kirchhoff establece que la suma de las diferencias de po- 
tencial alrededor de un circuito debe ser cero. Alrededor del circuito superior en la figura 2.6, 
las diferencias satisfacen (x2 — x,) + (6% — 12) = (x3 — x,). Estas diferencias son b, + b3 = 
b,. Para recorrer todo el circuito y regresar al mismo potencial, se requiere bz + b5 = Da. 

ES —2R E La prasba] para que e esté € en SN espacio in es la E del voltaje de Kicolk | 
Y hola. La s suma. a de e las is diferencias de Potencial ad alrededor de: un circuito debe ser cero. 
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Espacio nulo izquierdo: Para resolver A*y = 0, se encuentra su significado en la gráfi- 
ca. El vector y tiene cinco componentes, una para cada arista. Estos números representan 
corrientes que circulan a lo largo de las cinco aristas. Debido a que A* es de 4 por 5, las 
ecuaciones A*y = O proporcionan cuatro condiciones sobre estas cinco corrientes. Se trata 
de condiciones de “conservación” en cada nodo: En cada nodo, el flujo de entrada es 
igual al flujo de salida: 


=Y Y = Q La corriente total hacia el nodo 1 es cero 
AO AT hacia el nodo 2 
Ya + ys — ys =0 hacia el nodo 3 
Ya + ys =0 hacia el nodo 4 


La belleza de la teoría de redes es que tanto A como A* tienen papeles importantes. 

Resolver A*y = O significa encontrar un conjunto de corrientes que no se “amontone” 
en ningún nodo. El tráfico continúa circulando, y las soluciones más sencillas son las co- 
rrientes alrededor de circuitos pequeños. Nuestra gráfica tiene dos circuitos, y alrededor 
de cada circuito se envía 1 amp de corriente: 


Vectores de circuito y! =|[1 —1 1 0 0] y yi=[0 0 1 -—1 1]. 


Cada circuito produce un vector y en el espacio nulo izquierdo. La componente +10 —1 
indica si la corriente va en el sentido de la flecha o en contra. Las combinaciones de y, y 
y, llenan el espacio nulo izquierdo, por lo que y, y y, son una base (la dimensión tendría 
que serm — r= 53 — 3 = 2), De hecho, y, — ya = (1, —1,0, 1, —1) proporciona el gran 
circuito alrededor de la parte externa de la gráfica. 

El espacio columna y el espacio nulo izquierdo están relacionados estrechamente. El 
espacio nulo izquierdo contiene a y, = (1, —1, 1, 0, 0), y los vectores en el espacio colum- 
na satisfacen b, — ba, + b3 = 0. Así, yb = 0: ¡los vectores en el espacio columna y en el 
espacio nulo izquierdo son perpendiculares! Esto pronto se convertirá en la parte dos del 
“Teorema fundamental del álgebra lineal.” 


Espacio renglón: El espacio renglón de A contiene vectores en R*, pero no a todos los 
vectores. Su dimensión es el rango r = 3. Con la eliminación se encuentran tres renglones 
independientes, y también es posible ver la gráfica. Los tres primeros renglones son depen- 
dientes (renglón 1 + renglón 3 = renglón 2, y estas aristas forman un circuito). Los ren- 
glones 1, 2, 4 son independientes porque las aristas 1,2, 4 no contienen circuitos. 

Los renglones 1, 2, 4 son una base del espacio renglón. En cada renglón, la suma de 
los elementos es cero. Toda combinación (f1, £2, f3, f4) en el espacio renglón tiene la misma 
propiedad: 


f en el espacio renglón £ + f2 + f3 + f4 =0 x en el espacio nulo x = c(1, 1,1, 1) (2) 


Nuevamente, esto ilustra el teorema fundamental: el espacio renglón es perpendicular al es- 
pacio nulo. Si festá en el espacio renglón y x está en el espacio nulo, entonces f*x = 0. 

Para A*, la ley básica de la teoría de redes es la ley de la corriente de Kirchhoff. El flu- 
jo total hacia cada nodo es cero. Los números f,, f>, f3, f, son fuentes de corriente hacia los 
nodos. La fuente f, debe equilibrar a —y, — y, que es el flujo que sale del nodo 1 (a lo lar- 
go de las aristas 1 y 2). Esta es la primera ecuación en A*y = f De manera semejante en los 
otros tres nodos, la conservación de la carga requiere flujo de entrada = flujo de salida. Lo 
hermoso es que A* es exactamente la matriz derecha de la ley de la corriente. 
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e E corriente neta 2 hacia ra nodo a cero. Flujo de entrado = = > faja de salida. . 
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8 +£= 0. «Con F 00 Ja 21, A%y =0e es s satisfecha e una corriente, que recorre" 
el circuito. A po A A a 





Árboles generadores y renglones independientes 


Toda componente de y, y y, en el espacio nulo izquierdo es 1 o —1 o O (provenientes de 
los flujos en el circuito). ¡Lo mismo es cierto para x = (1, 1, 1, 1) en el espacio nulo, y to- 
dos los elementos en PA = LDU! La cuestión clave es que todo paso de la eliminación tie- 
ne un significado para la gráfica. 

El significado puede observarse en el primer paso de la eliminación para la matriz A: res- 
te el renglón 1 del renglón 2. Esto sustituye a la arista 2 por una nueva arista “1 menos 2”; 





arista 1 
E renglón 1-1 1 0 0 
arista 2 a renglón 2 -—1 0 1 0 
“ arista 1-— 2 renglón 1-— 2 0 1-1 0 


sn 


Ese paso de la eliminación destruye una arista y crea una nueva arista. Aquí la arista 1] — 2” 
es justo la arista 3 anterior en dirección opuesta. El siguiente paso de la eliminación produce 
ceros en el renglón 3 de la matriz. Esto demuestra que los renglones 1, 2, 3 son dependien- 
tes. Los renglones son dependientes si las aristas correspondientes contienen un circuito. 

Al final de la eliminación se tiene un conjunto completo de r renglones independien- 
tes. Estas r aristas constituyen un árbol: una gráfica sin circuitos. Nuestra gráfica tiene 

= 3, y las aristas 1, 2, 4 forman un árbol posible. El nombre completo es árbol generador 
porque el árbol “genera” todos los nodos de la gráfica. Un árbol generador tiene n — l aris- 
tas si la gráfica es conexa, y si se incluye una arista más se obtiene un circuito. 

En el lenguaje del álgebra lineal, n — l es el rango de la matriz de incidencia A. La 
dimensión del espacio renglón es n — 1. El árbol generador que se obtiene de la elimina- 
ción constituye una base para el espacio renglón: cada arista del árbol corresponde a un ren- 
glón en la base. 

El teorema fundamental del álgebra lineal relaciona las dimensiones de los subespacios: 


Espacio nulo: dimensión 1, contiene ax = (1l,..., 1). 
Espacio columna: dimensión r = n — 1, cualesquiera n — 1 columnas son indepen- 


dientes. 
Espacio renglón: dimensión r = n — 1, renglones independientes de cualquier árbol 
generador. 


Espacio nulo izquierdo: dimensión m — r =m— n + 1, contiene ys de los circuitos. 


Estos cuatro espacios proporcionan la fórmula de Euler, que de alguna manera es el pri- 
mer teorema en topología. Cuenta aristas de dimensión cero menos aristas unidimenstona- 
les más circuitos bidimensionales. Ahora cuenta con una demostración del álgebra lineal 
para cualquier gráfica conexa: 


(té de nodos) — (f de aristas) + (4 de circuitos) = (1) —(m) +(m=n+b=1 (3) 
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Para un simple circuito de 10 nodos y 10 aristas, el número de Euler es 10 — 10 + 1. Si 
todos y cada uno de esos 10 nodos están unidos a un undécimo nodo en el centro, enton- 
ces 11 — 20 + 10 sigue siendo 1. 

Todo vector f en el espacio columna tiene %f = f, + ++ - + f, = 0; la suma de las 
corrientes provenientes del exterior es cero. Todo vector b en el espacio columna tiene 
y ib = 0; la suma de las diferencias de potencial es cero alrededor de todos los circuitos. 
En algún momento, x y y se vincularán mediante una tercera ley (ley de Ohm para cada 
resistor). Primero nos quedamos con la matriz A para presentar una aplicación que parece 


frívola pero no lo es. 


A 
| 
| 
| 
| 


Clasificación de los equipos de fútbol 


Al final de esta temporada, los equipos de fútbol colegial son clasificados según varias en- 
cuestas. La clasificación es esencialmente un promedio de opiniones, y algunas veces se 
vuelve vaga después de las primeras doce universidades. Se desea clasificar a todos los 
equipos de acuerdo con una base más matemática. 

El primer paso es reconocer la gráfica. Si el equipo j jugó contra el equipo k, entonces 
entre ambos hay una arista. Los equipos son los nodos, y los juegos son las aristas. Hay unos 
cientos de nodos y algunos miles de aristas, a las que se asignará una dirección mediante una 
flecha que va del equipo visitante al equipo local. En la figura 2.7 se muestra parte de la Li- 
ga Ivy, así como algunos equipos serios, y también una universidad que no es famosa por sus 
logros en fútbol colegial. Afortunadamente para esa universidad (en donde estoy escribien- 
do estas líneas), la gráfica no es conexa. En términos matemáticos, no es posible demostrar 
que el MIT no es el número 1 (a menos que ocurra que juegue contra id 


o 


Harvard Yale Michigan Texas 
OS + 
l 
MIT ' 
$ 
Princeton Purdue Ohio State Notre Dame A Tech 


Figura 2.7 Parte de la gráfica de fútbol americano colegial. 


Si el fútbol fuese perfectamente consistente, a cada equipo podría asignarse un “po- 
tencial” x; Así, si un equipo visitante v juega con el equipo local h, entonces ganaría el 
equipo que tuviera mayor potencial. En el caso ideal, la diferencia b en el resultado sería 
exactamente igual a la diferencia x, — x, en sus potenciales. ¡Ni siquiera tendrían que ju- 
gar! Habría acuerdo por completo en que el mejor equipo es aquel con mayor potencial. 

Este método presenta dos dificultades (por lo menos). Se está intentando encontrar un 
número x para cada equipo, y se desea x, — x, = b, para cada juego. Esto significa unos 
cuantos miles de ecuaciones y sólo unos cuantos cientos de incógnitas. Las ecuaciones 
Xp 7 X, = b; van a un sistema lineal Ax = b, donde A es una matriz de incidencia. Todo 
juego o un renglón, con +1 en la columna A, y —1 en la columna v, con la finalidad de 
indicar qué equipos jugaron ese partido. 

Primera dificultad: Si b no está en el espacio columna no hoy solución. Los resultados 
deben ajustarse perfectamente o no es posible encontrar potenciales exactos. Segunda difi- 
cultad: Si A tiene vectores diferentes de cero en su espacio nulo, los potenciales x no están 
bien determinados. En el primer caso x no existe; en el segundo, x no es único. Quizá es- 
tén presentes ambas dificultades. 
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El espacio nulo siempre contiene el vector de 1s, ya que A sólo ve las diferencias 
Xp 7 Xy. Para determinar los potenciales, arbitrariamente podría asignarse potencial cero a 
Harvard. (Estoy hablando matemáticamente, no asumiéndolo como un hecho). Pero si la 
gráfica no es conexa, entonces toda pieza por separado de la gráfica contribuye a un vec- 
tor en el espacio nulo. Incluso está el vector con Xurr = 1 y todos los demás x, = O, Es ne- 
cesario unir no sólo a Harvard sino a un equipo en cada pieza. (No hay nada de injusto en 
asignar potencial cero; sí todos los demás potenciales están abajo de cero, entonces el equi- 
po unido se clasifica primero.) La dimensión del espacio nulo es el número de piezas de la 
gráfica: y no habrá forma de clasificar una pieza contra otra, ya que éstas no juegan par- 
tidos. 

Parece que el espacio columna es más difícil de describir. ¿Cuáles resultados se ajus- 
tan perfectamente bien a un conjunto de potenciales? Ciertamente Ax = b es irresoluble si 
Harvard derrota a Yale, Yale derrota a Princeton y Princeton derrota a Harvard. Más que lo 
anterior, la suma de las diferencias en los resultados de ese circuito de juegos debe ser cero. 


Ley de Kirchhoff para diferencias en los resultados byy + byp + py = 0. 


Ésta también es una ley del álgebra lineal. Ax = b puede resolverse cuando b satisface las 
mismas dependencias lineales que los renglones de A. Así, la eliminación lleva a 0 = 0. 

En realidad, casi con toda certeza b no está en el espacio columna. Los resultados de 
fútbol no son tan consistentes. Para obtener una clasificación es posible utilizar mínimos 
cuadrados: hacer a Ax lo más próximo posible de b. Eso se verá en el capítulo 3, y sólo se 
menciona un ajuste. El ganador obtiene un bono de 50 e incluso 100 puntos por arriba de 
la diferencia en resultados. En caso contrario, ganar por 1 está demasiado próximo a per- 
der por 1. Esto hace que las clasificaciones calculadas se aproximen bastante a las encues- 
tas, y el doctor Leake (Notre Dame) proporcionó un análisis completo en Management 
Science in Sports (1976). 

Después de escribir esta subsección, encontré lo siguiente en el New York Times: 


En sus clasificaciones finales en 1985, la computadora ubicó a Miami (10-2) en sép- 
timo lugar, arriba de Tennessee (9-1-2). Pocos días después de su publicación, al de- 
partamento de deportes del Times empezaron a llegar paquetes con naranjas y cartas 
de enojo, enviados por los fanáticos descontentos de Tennessee. La irritación surgió 
del hecho de que Tennessee apabulló a Miami 35-7 en el tazón del azúcar. Las en- 
cuestas finales de AP y UPI clasificaron en cuarto lugar a Tennessee, con Miami bas- 
tante más abajo. 

Ayer en la mañana llegaron nueve envases de naranjas al muelle de carga. Fueron 
enviadas al hospital Bellevue con una advertencia de que la calidad y contenido de 
las naranjas era incierto. 


Tanto, para esta aplicación del álgebra lineal. 


Redes y matemáticas discretas aplicadas 


Una gráfica se vuelve una red cuando a las aristas se asignan números C;,. . . , Cp» El nú- 
mero c, puede ser la longitud de la arista i, o su capacidad, o su rigidez (si contiene a un 
resorte), o su conductancia (si contiene un resistor). Estos números van en una matriz dia- 
gonal C que es de m por mm. C refleja “propiedades materiales”, en contraste con la matriz 
de incidencia A, que proporciona información de las conexiones. 

Nuestra descripción será en términos de electricidad. Sobre la arista í, la conductancia 
es c; y la resistencia es l/c, La ley de Ohm establece que la corriente y, que pasa 


IN mn 
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por el resistor es proporcional a la caída de tensión e; 
Ley de Ohio y, = c,e; (corriente) = (conductanciaXcaída de tensión). 


Lo anterior también se escribe £ = [R, caída de tensión igual a la corriente multiplicada 
por la resistencia. Como una ecuación vectorial sobre todas las aristas a la vez, la ley de 
Ohm es y = Ce. 

Para completar el marco de referencia se requieren la ley del voltaje y la ley de la co- 
rriente de Kirchhoff: 


LVK: La suma de las caídas de tensión alrededor de cada circuito es cero. 
LCK: La suma de las corrientes y, (y f;) hacia cada nodo es cero. 


La ley del voltaje permite asignar potenciales xy, ... , x, alos nodos. Luego, las diferen- 
cias alrededor de un circuito proporcionan una sumatoria como (x, — Xx) + (3 — Xx) + 
Ga — x3) = O, en la que todo se cancela. La ley de la corriente pide sumar las corrientes 
hacia cada nodo por la multiplicación de A*y. Si no hay fuentes de corriente externas, la 
ley de la corriente de Kirchhoff es ATy = 0. 

La otra ecuación es la ley de Ohm, pero es necesario encontrar la caída de tensión e a 
través del resistor. Con la multiplicación Ax se obtuvo la diferencia de potencial entre los 
nodos. Al invertir los signos, — Ax proporciona la caída en potencial. Parte de esta caída 
puede deberse a una batería en la arista de intensidad b,. El resto de la caída es e = b — 
Ax a través del resistor: 


Ley de Ohm — y=C(b-— Ax) obien C7!y + Ax = b. (4) 


Las leyes fundamentales de equilibrio combinan las leyes de Ohm y Kirchhoff en un 
problema central de las matemáticas aplicadas. Estas ecuaciones aparecen en todas partes: 





S 





Ecuaciones de equilibrio : dE ÓN 


Este es un sistema lineal simétrico, del cual ha desaparecido e. Las incógnitas son las co- 
rrientes y y los potenciales x. Usted ve la matriz simétrica por bloques: 


—1 
Forma de bloques E E P | = Al (6) 


Para eliminación por bloques el pivote es C”!, el multiplicador es A*C, y la sustracción 
manda a A* abajo del pivote. El resultado es 


En A Ml b 
O  —ATCA| lx| |f-—ATChb 


La ecuación sólo para x está en el renglón inferior, con la matriz simétrica ATCA: 


(1) 





>, 


Ecuación fundamental ATCAx > 1 E 
Luego, la sustitución hacia atrás en la primera ecuación produce y. Nada misterioso: se sus- 
tituye y = C(b — Ax) en A*y = f para obtener (7). 


Observación importante Un potencial debe fijarse de antemano: x, = 0. El n-ésimo no- 
do está conectado a tierra, y la n-ésima columna de la matriz de incidencia original se ha 
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eliminado. La matriz resultante es lo que ahora se entiende por A, sus n — 1 columnas son 
independientes. La matriz cuadrada A*CA, que es la clave para resolver la ecuación (7) pa- 
ra x, es una matriz invertible de orden n — 1: 


n=—1 porm m por m mpor n —1 SIDOR RR 


ANS 


Ejemplo 1 Suponga que una batería bz y una fuente de corriente f, (y cinco resistores) conectan cua- 
tro nodos. El nodo 4 está conectado a tierra y el potencial xy = O es fijo, 


Yi Ri Z1 


Ys 


Z2 


Ra Rs 


Ya 
L3 





Za =0 


Ra Ya - 


La primera cuestión es la ley de la corriente A*y = fen los nodos 1, 2, 3: 


A SO —] O -—1 O -—1 
Y. Yo = f, tiene Al = Ll 0 0 03% 
Ya +Y ys =0 0 1 1 —1 0 


Para el nodo 4 no se ha escrito ninguna ecuación, donde la ley de la corriente es y4 + ys + 
f, = 0. Esto se concluye al haber sumado las otras tres ecuaciones. 

La otra ecuación es C7 ly + Ax = b. Los potenciales x están conectados a las corrien- 
tes y por la ley de Ohm. La matriz diagonal C contiene las cinco conductancias c; = 1/R,. 
El miembro derecho explica la batería de intensidad bz en la arista 3. La forma de bloque 
tiene a CTly + Ax = barriba de A*y =f: 


R; 1 1 0 Y1 0 

Ra 0 +4 11 ly 0 

R;3 ==] 0 1 Y3 by 

ar si M Y Ra O 00 =P 7 0 
AF Oller” Rs -1 0 0llyw!l 10 
e | 05) Un E Xi 0 

Ll 451 O 0 y 2 Fa 


Lo 1 1-1 0 lbs] Lo 


El sistema es de 8 por 8, con cinco corrientes y cuatro potenciales. La eliminación de las 
ys reduce al sistema de 3 por 3 A*CAx = AFCb — f. La matriz A*CA contiene los recípro- 
cos c; = 1/R, (porque en la eliminación se dividen los pivotes). También se muestran el 
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cuarto renglón y la cuarta columna, provenientes del nodo conectado a tierra, fuera de la 
matriz de 3 por 3: 


c+c3+c0s  —Cy —C3 —c5 (nodo 1) 
ACA E 61 CC E) 0 (nodo 2) 
Ea —C> Ca + C3 +Ca —Ca (nodo 3) 
ES 0 LE Cat Cs (nodo 4) 





El primer elemento es 1 + 1 + 1,0 c, + c3 + cs cuando se incluye C, ya que las aristas 
1, 3, 5 tocan el nodo 1. El siguiente elemento diagonal es 1 + 1 o c, + cz, provenientes de 
las aristas que tocan al nodo 2. Fuera de la diagonal, las cs aparecen con signo menos. Las 
aristas hacia el nodo 4 conectado a tierra pertenecen al cuarto renglón y a la cuarta colum- 
na, que se borran una vez que la columna 4 se elimina de A (haciendo invertible aAY CA). 
La matriz de 4 por 4 debe cumplir que la suma de todos los renglones y todas las colum- 
nas es cero, y que (1, 1, 1, 1) debe estar en el espacio nulo. 
Observe que A*CA es simétrica. Tiene pivotes positivos y proviene del marco de re- 
ferencia básico de las matemáticas aplicadas que se ilustra en la figura 2.8. 





C (Ley de Ohm ) 
Figura 2.8 Marco de referencia para equilibrio: fuentes b y f, tres pasos para ACA. 


En mecánica, x y y se vuelven desplazamientos y esfuerzos. En fluidos, las incógni- 
tas son la presión y el caudal de flujo. En estadística, e es el error y x es el mejor ajuste 
por mínimos cuadrados a los datos. Estas ecuaciones matriciales y las ecuaciones diferen- 
ciales correspondientes se encuentran en nuestro libro de texto Introduction to Applied 
Mathematics, y en el nuevo Applied Mathematics and Scientific Computing. (Consulte la 
página www.wellesleycambridge.com.) 

Este capítulo termina en un punto culminante: el planteamiento de un problema fun- 
damental en matemáticas aplicadas. A menudo para esto se requiere más habilidad que pa- 
ra la solución del problema. En el capítulo 1 se resolvieron ecuaciones lineales como 
primer paso del álgebra lineal. Para plantear las ecuaciones se requiere el conocimiento 
más profundo del capítulo 2. La contribución de las matemáticas, y de la gente, no es la 


| 
| 
| 
| 
| 
| 





Conjunto de problemas 2.5 


1. Para la gráfica triangular de 3 nodos de la siguiente figura, escriba la matriz de inci- 
dencia A de 3 por 3. Encuentre una solución de Ax = O, y describa todos los otros vec- 
tores en el espacio nulo de A. Encuentre una solución de A*y = 0, y describa todos los 
otros vectores en el espacio nulo izquierdo de 4. 

2. Para la misma matriz de 3 por 3, demuestre directamente a partir de las columnas que 
todo vector b en el espacio columna satisface b, + b, — b3 = 0. Deduzca el mismo 


nodo 2 arista 2 nodo 3 Ta 


E 


10. 
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nodo 1 





arista 3 





hecho a partir de los tres renglones: las ecuaciones en el sistema Ax = bh. ¿Qué signi- 
fica esto sobre las diferencias de potencial alrededor de un circuito? 

Demuestre directamente a partir de los renglones que todo vector f'en el espacio ren- 
glón satisface f, + f¿ + fi = 0. Deduzca el mismo hecho a partir de las tres ecuacio- 
nes A*y = f ¿Qué significa esto cuando las fs son corrientes hacia los nodos? 


Calcule la matriz ATA de 3 por 3, y demuestre que es simétrica aunque singular: ¿qué 
vectores están en su espacio nulo? Al eliminar la última columna de A (y también el 
último renglón de A*) se queda con la matriz de 2 por 2 en la esquina superior izquier- 
da; demuestre que es no singular. 


Escriba la matriz diagonal C con elementos c;,, cz, cz en medio, y calcule ATCA. De- 
muestre nuevamente que la matriz de 2 por 2 en la esquina superior izquierda es in- 
vertible. 


Escriba la matriz de incidencia A de 6 por 4 para la segunda gráfica en la figura. El 
vector (1, 1, 1, 1) está en el espacio nulo de A, pero ahora ahí hay m — n + 1 = 3 vec- 
tores independientes que satisfacen AFy = O, Encuentre tres vectores y, y únalos con 
los circuitos en la gráfica. 


Si esa segunda gráfica representa seis juegos entre cuatro equipos, y las diferencias en 
los resultados son b,,. .. , bg, ¿cuándo es posible asignar potenciales x;, . . . , x4 de 
modo que la diferencia de potenciales coincida con las bs? Usted está encontrando 
(a partir de las leyes de Kirchhoff o por eliminación) las condiciones que hacen reso- 
luble a 4x = b. 


Escriba las dimensiones de los cuatro subespacios fundamentales para esta matriz de 
incidencia de 6 por 4, y una base para cada subespacio. 


Calcule ATA y A*CA, donde la matriz diagonal C de 6 por 6 tiene los elementos 
C1, + - - , Cg. ¿Cómo puede afirmar a partir de la gráfica dónde aparecen las cs en la dia- 
gonal principal de AYCA? 


Trace una gráfica con aristas numeradas y dirigidas (y con nodos numerados) cuya 
matriz de incidencia es 


A 
eS 
E o NE ME E, 
A A 


Esta gráfica, ¿es un árbol? (los renglones de A, ¿son independientes?) Demuestre que 
al eliminar la última arista se obtiene un árbol generador. Así, los renglones restantes 
son una base de z 


A A rd 
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11. 


12, 


13. 


14, 


15, 


16. 


EA 


18, 


19. 
20. 


21. 


Sin la última columna de la A precedente, y con los números 1, 2, 2, 1 en la diagonal 
de C, escriba el sistema de 7 por 7 


Cy + Ax =0 
A*Yy = f. 


Al eliminar y1, Ya, Y3, ya se queda con tres ecuaciones ATCAx = —f para x,, X2, X3. Re- 
suelva las ecuaciones cuando f = (1, 1, 6). Con estas corrientes entrando en los nodos 
1, 2, 3 de la red, ¿cuáles son los potenciales en los nodos y las corrientes en las aris- 
tas? 


Si A es una matriz de incidencia de 12 por 7 de una gráfica conexa, ¿cuál es su rango? 
¿Cuántas variables libres hay en la solución de Ax = b? ¿Cuántas variables libres hay 
en la solución de A*y = f? ¿Cuántas aristas deben eliminarse para obtener un árbol 
generador? 


En la gráfica anterior con 4 nodos y 6 aristas, encuentre todos los 16 árboles genera- 
dores. 


Si MIT derrota a Harvard por 33 a O, Yale empata con Harvard, y Princeton derrota a 
Yale por 7 a 6, ¿qué diferencias en los resultados en los otros tres juegos (H-P, MFT-P, 
MIT-Y) permiten diferencias de potencial que coincidan con las diferencias en los re- 
sultados? Si las diferencias en los resultados se conocen en un árbol generador, enton- 
ces se conocen para todos los juegos. 


En nuestro método de clasificación de fútbol, ¿es necesario considerar la fuerza de la 
oposición, o ya está considerada? 


Si entre cada par de nodos hay una arista (una gráfica completa), ¿cuántas aristas hay? 
La gráfica tiene n nodos, y no se permiten aristas de un nodo hacia sí mismo. 


Para las dos gráficas que se muestran a continuación, compruebe la fórmula de Euler: 
(+ de nodos) — (GH de aristas) + ($ de circuitos) = 1. 


Multiplique matrices para encontrar A*A, y conjeture cómo provienen sus elementos 
de la gráfica: 

a) La diagonal de AYA indica cuántos (cuántas) hay en cada nodo. 

b) Los elementos —1 o O fuera de la diagonal indican cuáles pares de nodos son _____. 





¿Por qué el espacio nulo de ATA contiene a (1, 1, 1, 1)? ¿Cuál es su rango? 


¿Por qué una gráfica con n = 6 nodos tiene m = 15 aristas? Un árbol generador que 
une a todos los seis nodos tiene aristas. ¡Hay n”"? = 6* árboles generadores! 





La matriz de adyacencia de una gráfica tiene M¿, = 1 si los nodos i y j están unidos 
por una arista (en caso contrario M,¿, = 0). Para la gráfica del problema 6 con 6 nodos 
y 4 aristas, escriba M y también M”. ¿Por qué (M4?),¿ cuenta el número de rutas de 2 
pasos del nodo i al nodo ¡? 
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2.6 TRANSFORMACIONES LINEALES 


Se sabe cómo una matriz mueve los subespacios alrededor cuando se multiplica por A. El 
espacio nulo se va al vector cero. Todos los vectores van hacia el espacio columna, ya que 
Ax siempre es una combinación de las columnas. Pronto verá algo hermoso: que A lleva su 
espacio renglón en su espacio columna, y que sobre estos espacios de dimensión res 100% 
invertible. Esta es la verdadera acción de A. Parcialmente está escondida por los espacios 
nulos y los espacios nulos izquierdos, que están a ángulos rectos y llevan su propio cami- 
no (hacia cero). 

Lo que importa ahora es lo que ocurre dentro del espacio, lo cual significa dentro del 
espacio n-dimensional, si Á es de n por n. Esto requiere un análisis más detallado. 

Suponga que x es un vector n-dimensional. Cuando A se multiplica por x, transforma 
ese vector en uno nuevo Ax. Esto ocurre en todo punto x del espacio n-dimensional R”. La 
matriz Á transforma todo el espacio, o lo “mapea en sí mismo”. En la figura 2.9 se ilustran 
cuatro transformaciones que provienen de estas matrices: 





c oO 1. Un múltiplo de la matriz identidad, A = cl, alarga cada vector 
A= F o por el mismo factor c. Todo el espacio se dilata o contrae (o de al- 
guna forma pasa por el origen y sale por el lado opuesto, cuando 
c es negativo). 
0 6-1 2. Una matriz rotación hace girar a todo el espacio alrededor del 4 
as | 1 o! origen. Este ejemplo gira 90 a todos los vectores, transformando ' 
cada punto (x, y) en (—y, x). | 
0] 3. Una matriz reflexión transforma a todos los vectores en su ima- 
A= : A gen especular. En este ejemplo el espejo es la recta x = y a 45", 
y un punto como (2, 2) permanece sin cambio. Un punto como (2, 
—2) se invierte en (—2, 2). Sobre una combinación como v = (2, 
2) + (Q, —2) = (4, 0), la matriz preserva una parte e invierte la 
otra. El resultado es Av = (2,—2) + (-2, 2) = (0, 4). 
¡Esa matriz reflexión es también una matriz permutación! Al- 
gebraicamente es tan sencillo, mandar (x, y) a (y, x), que la repre- 
sentación geométrica se ocultó. 
O E 4. Una matriz proyección transforma todo el espacio en un subespa- 
ias E o cio de dimensión inferior (no invertible). El ejemplo transforma 
cada vector (x, y) en el plano hasta el punto más próximo (x, 0) 
sobre el eje horizontal. Este eje es el espacio columna de 4. El eje 
y que proyecta a (0, 0) es el espacio nulo. 
cx, O 
i ig ly, z) e 
/ , 
A A 
xe | y 
(z ) y) | E cOn 4 
a AS 
alargamiento rotación de 90? reflexión (espejo a 45%) proyección sobre el eje ; 


Figura 2.9 Transformaciones del plano realizadas por cuatro matrices. 
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Estos ejemplos pudieron presentarse en tres dimensiones. Hay matrices para alargar la 
Tierra, hacerla girar o reflejarla a través del plano del ecuador (el Polo Norte se transforma 
en el Polo Sur). Hay una matriz que proyecta todo sobre ese plano (ambos polos al centro). 
También es importante reconocer que las matrices no pueden hacer todo, y que algunas 
transformaciones T(x) no son posibles con Ax: 





1) Es imposible mover el origen, ya que A0 = O para toda matriz. 

ii) Siel vector x se va en x”, entonces 2x debe irse en 2x'. En general, cx debe irse en cx”, 
ya que A(cx) = c(Ax). 

iii) Si los vectores x y y se van en x' y y”, entonces su suma x + y se debe ir en x” + y”, 
ya que A(x + y) = Ax + Ay. 


La multiplicación de matrices impone estas reglas sobre la transformación. La segunda re- 
gla contiene a la primera (tome c = O para obtener AO = 0). La regla 11i) se vio en acción 
cuando (4, 0) se reflejó a través de la recta a 45%. Se separó en (Q, 2) + (Q, —2) y ambas 
partes fueron reflejadas por separado. Lo mismo puede hacerse para las proyecciones: se- 
parar, proyectar por separado, y sumar las proyecciones. Estas reglas son válidas para cual- 
quier transformación que provenga de una matriz. 

Esta importancia les ha ganado una denominación: las transformaciones que cumplen 
las reglas i) a 11i) se denominan transformaciones lineales. Las reglas pueden combinarse 
en un a 


» En . tas » SIA A A A A RS TNT AN E RA DI AS a e 
NS O E, » , A, E e .” q Ti eras Dal E A AO ¡AR : w 


| E Í Para todos 157 números. c cy d y todos los y Vectores x E » la multiplicación de 
1atrices satisface la regla. de linealidad: i | o 


A(cx + dy) = “c(Ax) + HAY. E 1 










M2 


po sk t tr o mm ¡ciór n 760), que cumple. este, requerimiento es. una, transformación 





Cualquier matriz lleva de inmediato a una transformación lineal. La pregunta más intere- 
sante es en la dirección opuesta: ¿Toda transformación lineal lleva a una matriz? El obje- 
tivo de esta sección es encontrar la respuesta: sí. Este es el fundamento de un método del 
álgebra lineal —empezar con la propiedad 1) y desarrollar sus consecuencias—, esto es 
mucho más abstracto que el método más importante de este libro. Aquí se eligió empezar 
directamente con matrices, y a continuación se verá cómo representan transformaciones li- 
neales. 

Una transformación no necesita ir de R” al mismo espacio R”. Se permite absolutamen- 
te transformar vectores en KR” en vectores en otro espacio distinto R”. ¡Esto es exactamen- 
te lo que hace una matriz de m por n! El vector original x tiene n componentes, y el vector 
transformado Ax tiene m componentes. La regla de linealidad la cumplen igualmente las ma- 
trices rectangulares, de modo que éstas también producen transformaciones lineales. 

A estas alturas del libro, no hay razón para detenerse. Las operaciones sobre la condi- 
ción de linealidad 1) son la suma y la multiplicación por un escalar, aunque x y y no nece- 
sitan ser vectores columna en R”. Éstos no son los únicos espacios. Por definición, 
cualquier espacio vectorial permite las combinaciones cx + dy, los “vectores” son x y y, 
aunque en realidad pueden ser polinomios, matrices o funciones x(1) y y(1). En la medida 
en que la transformación cumpla la ecuación 1), es lineal. 

Como ejemplos se toman los espacios P,,, donde los vectores son polinomios p(£) de 
grado n. Se denotan como p = ay + ayt +: -+ +a,t” y la dimensión del espacio vectorial 
es n + 1 (debido a que con el término constante, hay n + 1 coeficientes). 


e 
O A _ di “as, b e 
Pr 0 AAA TRAMA a maca 94000 MZA AA, CACA MR AAA PAIN EI TARA CEE TARA DA ADA - 





Ejemplo 1 


Ejemplo 2 


Ejemplo 3 
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La operación de diferenciación, A = d/dt, es lineal: 
d n de | 
ANO == (0 habra dp ema. ; (2) 


El espacio nulo de esta A es el espacio unidimensional de constantes: day /dt = O. El espa- 
cio columna es el espacio n-dimensional P,,_.,; el miembro derecho de la ecuación (2) 
siempre está en ese espacio. La suma de la nulidad (= 1) y el rango (= n) es la dimensión 
del espacio original P,. 


La integración desde O hasta £ también es lineal (lleva P,, a P,,., 1): 


É 
a 
Ap(t) = / (Ay +++ apt) dt = at + e ARPA, (3) 
0 n+l 

Esta vez no hay espacio nulo (¡excepto por el vector cero, como siempre!) pero la integra- 
ción no produce todos los polinomios en P,., ¡. El miembro derecho de la ecuación (3) no 
tiene término constante. Probablemente los polinomios constantes sean el espacio nulo iz- 
quierdo. 


La multiplicación por un polinomio fijo como 2 + 31 es lineal: 
Ap) =Q +30(4) +: + ant”) =20 ++: +23a,1"*,. 
De nuevo, esto transforma P,, en P,, ,, sin espacio nulo excepto p = 0. 


En estos ejemplos (y en casi todos los ejemplos), no es difícil comprobar la linealidad. 
Incluso, difícilmente parece interesante hacerlo. Si hay linealidad, prácticamente es impo- 
sible ignorarla. A pesar de ello, se trata de la propiedad más importante que puede tener una 
transformación.” Por supuesto, la mayor parte de las transformaciones no son lineales: por 
ejemplo, para elevar al cuadrado al polinomio (Ap = p?), o sumar 1 (Ap = p + 1), o pre- 
servar los coeficientes positivos (A(t+ — 2) = £). Son las transformaciones lineales, y sólo 
éstas, lo que leva a las matrices. 


Transformaciones representadas por matrices 


La linealidad tiene una consecuencia crucial: Si se conoce Ax para cada vector en una ba- 
se, entonces se conoce Ax para cada vector en todo el espacio. Suponga que esta base 
consta de los n vectores X;, . . . , Xy. Cualquier otro vector x es una combinación de estos 
vectores particulares (generan el espacio). Así, la linealidad determina Ax: 


Linealidad si x =cx, +*** + Cpx, entonces Áx =c (Ax) ++": +c,(Axp). (4) 


Una vez que la transformación 7(x) = Ax ha decidido qué hacer con los vectores de la ba- 
se, ya no tiene libertad disponible. El resto es determinado por la linealidad. El requeri- 
miento 1) para dos vectores x y y lleva a la condición 4) para n vectores X;, . . . , Xy». La 
transformación tiene manos libres con los vectores en la base (son independientes). Una 
vez que éstos se establecen, también se establece la transformación de cada vector. 


*En orden de importancia, quizá en segundo lugar esté la invertibilidad. 





| 
Ll 
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Ejemplo 4 


¿Qué transformación lineal lleva x, y x, a Ax, y Ax2? 


1 S 0 Z 
Xx] = A sevaen Ax = 31; x= A sevaen Ax2= j6l. 
4 8 


Debe ser la multiplicación T(x) = Ax por la matriz 


2 4 
A=|3 61. 
4 8 


Empezando con una base distinta (1, 1) y (2, —1), esta misma A también es la única trans- 
formación lineal con 


6 0 
a |] - 9 y a [3 = [o] 
12 0 


Luego se encuentran matrices que representan diferenciación e integración. Primero 
debe decidirse sobre una base. Para los polinomios de grado 3 hay una elección natural 
para los cuatro vectores de la base: 


Base de P; pal pat po" p=t. 
Esta base no es única (nunca lo es), pero se requiere de una elección, y ésta es la más con- 
veniente. Las derivadas de estos cuatro vectores de la base son 0, 1, 2£, 3É: 


Acción de d/dt Ap, =0, Ap2=pi, Ap3,=2p,, Apa= 3px. (5) 


“dldf” actúa de inmediato exactamente como una matriz, pero ¿cuál matriz? Suponga que 
se está trabajando en el espacio tetradimensional de costumbre con la base de costumbre, 
los vectores de coordenadas p, = (1, 0, 0, 0), p, = (0, 1, 0, 0), p3 = (0, O, 1, 0), pa = (0, 
O, O, 1). La matriz es decidida por la ecuación (5): 


Matriz diferenciación Asp = 


er eo a o 
O oo -— 
OOoOoNOo 
O Ur OO 


Ap, es su primera columna, que €s cero. Ap, es la segunda columna, que es p,. Ap3 es 2p», 
y Apa es 3p3. El espacio nulo contiene a p; (la derivada de una constante es cero). El espa- 
cio columna contiene a py, P», p3 la derivada de una cúbica es una cuadrática). La deriva- 
da de una combinación como p = 2 + 1 — É — É es decidida por la linealidad, y no hay 
nada nuevo en eso: es la forma en que todos diferenciamos. Sería absurdo memorizar la de- 
rivada de cada polinomio. 

La matriz puede diferenciar este p(£), ¡porque las matrices incluyen linealidad! 


O E 00 2d 1 
e ES 0003 MN O => LL 2-3, 
070-000 + 0 


| 
j 
i 
| 
| 


A NA AX A | E A A A A O E AMIA A UA, rro Td An GO MAL A TT A A A 





SIE IN IA . 
PIERA a, E 
A e ise 
Janes o 
Pr. 
IN o p< i 
« 
¿0 





En breve, la matriz contiene toda la información esencial. Si se conoce la base, y se cono- 
ce la matriz, entonces se conoce la transformación de cada vector. 

La codificación de la información es sencilla. Para transformar un espacio en sí mis- 
mo, basta una base. Una transformación de un espacio en otro requiere una base para cada 


espacio. 
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eN d y 
Mas : 
E LEON os : SE E ANT Daó+ 4 
q 


Ta) => > Ax, = ayy + yy + ná +9) 





Para la matriz diferenciación, la columna 1 provino del primer vector de la base, 
p, = 1. Su derivada es cero, de modo que la columna 1 es cero. La última columna provi- 
no de (d/dt? = 32. Debido a que 31% = Op, + Op, + 3p3 + Opa, la última columna con- 
tenía a 0, 0, 3, 0. La regla (6) construye la matriz, columna por columna. 

Para la integración se hace lo mismo. Ahí se ya de cúbicas a cuárticas, transformando 
V = P, en W = P,, por lo que se requiere una base de W. La elección natural es y, = 1, 
Ya =t, y3 =P, ya =P, ys = £, generando los polinomios de grado 4. La matriz A es de m 
por n, o de 5 por 4. Proviene de la aplicación de la integración a cada vector de la base de E 


V: K 
. 1] 
: 

l 


E lt 1 1 
/ 1dt =f obien, Ax; = Ya, +...» / Pdi=-=!'" oObien, Axa = ys. 
0 0 El 4 
00.00 
EROS" “0370 
Matriz integración Ap = 09 + 000.0 
0.0 ¿0 
0.00 0-7 


La diferenciación y la integración son operaciones inversas. O por lo menos la integración 
seguida de la diferenciación regresa a la función original. Para hacer que esto ocurra para 
las matrices, se requiere la matriz diferenciación de cuárticas a cúbicas, que es de 4 por 5: 


Ade AdrÁAm = 


¡Oo o 

DO000 rm 

O ONO 

O WY0o 

4000 
< 


La diferenciación es una inversa izquierda de la integración. ¡Las matrices rectangulares 
no pueden tener inversas por ambos lados! En el orden opuesto, Ajn:4 a. = Y no puede ser | 
cierto. El producto de 5 por 5 tiene ceros en su columna 1. La derivada de una constante 
es cero. En las otras columnas Ain 4 a. es la identidad, y la integral de la derivada de 1” 


es” 


» 
Bonares . 
arar pa 
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Rotaciones Q, proyecciones P y reflexiones H 


Esta sección empieza con rotaciones de 90%, proyecciones sobre el eje x, y reflexiones a 
través de la recta a 45%. Sus matrices son especialmente sencillas: 


O E E al 
ei robo “ko 
(rotación) (proyección) (reflexión) 


Las transformaciones lineales subyacentes del plano x-y también son sencillas. Sin embar- 
go, las rotaciones a través de otros ángulos, las proyecciones sobre otras rectas, y las refle- 
xiones en otros espejos son casi tan fáciles de visualizar. Siguen siendo transformaciones 
lineales, suponiendo que el origen esté fijo: A0 = O. Deben estar representadas por matri- 


ces. Usando la base natural [¿] y [7], se desea descubrir estas matrices. 


1. Rotación En la figura 2.10 se muestra la rotación de un ángulo 0. También muestra 
el efecto sobre los dos vectores de la base. La primera va a (cos 0, sen 0), cuya longitud si- 
gue siendo 1; está en la “recta 0”. El segundo vector base (0, 1) rota en (—sen 6, cos 6). Por 
la regla (6), estos números van a las columnas de la matriz (se usa c para cos O y s para sen 
6). Esta familia de rotaciones Oj constituye una oportunidad perfecta para probar la corres- 
pondencia entre las transformaciones y las matrices: 


¿La inversa de Oj es igual a O ..¿ (rotación hacia atrás por un ángulo 0)? Sí, 


A E E AN AS, 
colo] 9-9 


¿El cuadrado de Q, es igual a Q»p (rotación por un ángulo doble)? Sí, 


a a a paseo des a cos 20 0 5En 20 
9 S cl ls  <c 2cs Cc? — y? sen 20 cos 28 | 


¿El producto de Qo y O, es igual a Qo+, (rotación por un ángulo 0 y luego ()? Sí. 


DS bu —senOsenp - + - ] e pun (Oro... | 


senó cos y +cosOseng sen (9 +) 





Figura 2.10 Rotación en un ángulo 0 (izquierda). Proyección sobre la recta 0 (derecha). 
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El último caso contiene a los dos primeros. La inversa aparece cuando gp es —6, y el cua- 
drado aparece cuando gy es + 6. Estas tres ecuaciones fueron decididas por identidades tri- 
gonométricas (y constituyen una nueva manera de recordar estas identidades). No es 
accidental que la respuesta a las tres preguntas sea sí. La multiplicación de matrices se de- 
fine exactamente de modo que el producto de las matrices corresponda al producto de las 
DAS 














| E «Suponga que. E y B: son a ho: de v: a a Wy y de U. a y. Sup pro > e a 
ducto AB. empieza con un vector u en U, vaa Bu en Y, y. termina con AB en w. ¡Es O 
E “composición”. ¡AB de. nuevo es una transformación lineal. (deU a Mw. Su matriz Se 
EX os el producto « de las matrices individuales que, representan. A yB. BN | 


Para Agir Ajo la transformación compuesta era la identidad (y Aja; Ay, aniquilaron a 
todas las constantes). Para rotaciones, el orden de la multiplicación no importa. Así, U = 
V = W es el plano x-y, y 040, es lo mismo que Q,¿0y. Para una rotación y una refle- 
xión, el orden sí es importante. 


Nota técnica: Para construir las matrices, se requieren bases de V y W, y luego para U y 
V, Al mantener la misma base para V, el producto de matrices va correctamente de la ba- 
se en U a la base en W. Si la transformación A se distingue de su matriz (sea ésta [4])), en- 
tonces la regla del producto 2V se vuelve extremadamente concisa: [4B] = [4][5]. La regla 
para multiplicar matrices, en el capítulo 1 estaba totalmente determinada por este requerl- 
miento: debe corresponder al producto de transformaciones lineales. 


2. Proyección En la figura 2.10 también se muestra la proyección de (1, 0) sobre la recta 
6. La longitud de la proyección es c = cos 6. Observe que el punto de proyección no es (c, 
s), como yo consideraba erróneamente; la longitud de ese vector es 1 (es la rotación), de 
modo que es necesario multiplicar por c. De manera semejante, la longitud de la proyec- 
ción de (0, 1) es s, y cae en s(c, s) = (cs, s*). Así se obtiene la segunda columna de la ma- 
triz proyección P: 
Ñ cd? cs 

Proyección sobre la recta O P= | | 


ESE 
Esta matriz no tiene inversa, porque la transformación no tiene inversa. Los puntos sobre 
la recta perpendicular son proyectados sobre el origen; esa recta es el espacio nulo de P. 
¡Los puntos sobre la recta 9 son proyectados sobre sí mismos! Proyectar dos veces es lo 
mismo que proyectar una vez, y P? = P: 


p?= e esl' ACA A a | p 
cs >? esto? +52 sc? +8?) 


Por supuesto, c? + sí? = cos? 9 + sen? 9 = 1. Una matriz proyección es igual a su propio 
cuadrado. 


3. Reflexión En la figura 2.11 se muestra la reflexión de (1, 0) en la recta 9. La longitud 
de la reflexión es igual a la longitud del original, como era después de la rotación; sin em- 
bargo, en este caso la recta O permanece donde está. La recta perpendicular invierte la direc- 
ción; todos los puntos pasan directamente a través del espejo. La linealidad decide el resto. 


20? —1 2cs 
ZCS 25? — 1 


Matriz reflexión H = | 
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n=2P=1=[*' 2cs | 


Zcs  25s%-—1 
imagen + original = 2 X proyección 


Hxr+zx=2Px 





0 


AS red e 0 M0 
% 5 1|  [2s*-1 


Figura 2.11 Reflexión a través de la recta 0: geometría y matriz. 


La matriz H posee la extraordinaria propiedad H? = 1. Dos reflexiones devuelven el origi- 
nal. Una reflexión es su propia inversa, H = H”?, lo cual resulta evidente a partir de la geo- 
metría pero es menos evidente a partir de la matriz. Un método es a través de la relación 
de las reflexiones con las proyecciones: H = 2P — [. Esto significa que Hx + x = 2Px: la 
imagen más el original es igual a dos veces la proyección. También confirma que E? = 1: 


H? =(2P-1? =4P?-4P+I1=I1, yaque P? =P. 


Otras transformaciones Ax pueden incrementar la longitud de x; el alargamiento y el 
esfuerzo cortante se encuentran en los ejercicios. Cada ejemplo tiene una matriz que lo re- 
presenta, lo cual constituye la cuestión más importante de esta sección. Sin embargo, tam- 
bién está la cuestión de elegir una base, y se recalca que la matriz depende de la elección 
de la base. Suponga que el primer vector en la base está sobre la recta € y que el segundo 
vector en la base es perpendicular: 


1.0 
0 0 


siempre: su primera columna proviene del primer vector en la base (proyectado en 
sí mismo). La segunda columna proviene del vector en la base que es proyectado en 
cero. 


i) La matriz proyección es regresada por P = | . Esta matriz se construye como 


1 
0 


base es reflejado sobre su negativo para producir esta segunda columna. La matriz H 
sigue siendo 2P — [ cuando la misma base se usa para H y P. 


11) Para reflexiones, esa misma base proporciona H = | 0 .El segundo vector en la 


111) Para rotaciones, la matriz no cambia. Estas rectas siguen rotando un ángulo 0, y 


O = DE al como antes. 


Toda la cuestión de elegir la mejor base es absolutamente fundamental, por lo que en el ca- 
pítulo 5 se abordará nuevamente. El objetivo es hacer diagonal a la matriz, como se logró 
para P y H. Para hacer diagonal a O se requieren vectores complejos, ya que todos los vec- 
tores reales están rotados. 

Aquí se menciona el efecto que tiene sobre la matriz un cambio de base, mientras las 
transformaciones lineales permanecen igual. La matriz A (o Q, o P, o H) se modifica a 
STIAS. Así, una simple transformación es representada por varias matrices (mediante ba- 
ses diferentes, tomadas en cuenta por $). La teoría de los vectores característicos conduce 
a la fórmula S7'AS, así como a la mejor base. 
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Conjunto de problemas 2.6 


1. 


10. 


11. 


12. 


13. 


¿Qué matriz tiene el efecto de rotar cada vector un ángulo de 90? y luego proyectar el 
resultado sobre el eje x? ¿Qué matriz representa la proyección sobre el eje x seguida 
de la proyección sobre el eje y? 


. El producto de $ reflexiones y 8 rotaciones del plano x-y, ¿produce una rotación o una 


reflexión? 
: 2.0 : EE , 
La matriz A = le il produce un alargamiento en la dirección x. Trace el círculo 


x + y? = 1 yasu alrededor trace los puntos (2x, y) que resultan de la multiplicación 
por A. ¿Qué forma tiene esa curva? 


Toda recta sigue siendo recta después de una transformación lineal. Si z está a la mi- 
tad entre x y y, demuestre que Az está a la mitad entre Ax y Ay. 

La matriz Á = E a produce una transformación por esfuerzo cortante, que deja el 
eje y sin cambio. Bosqueje este efecto en el eje x, indicando lo que ocurre a (1, 0) y 
(2, 0) y (—1, 0), y cómo se transforma todo el eje. 


. ¿Cuáles son las matrices de 3 por 3 que representan las transformaciones que 


a) proyectan cada vector sobre el plano x-y? 

b) reflejan cada vector a través del plano x-y? 

c) rotan el plano x-y un ángulo de 90%, dejando sólo al eje z? 

d) rotan un ángulo de 907 al plano x-y, luego al plano x-z, y luego al plano y-z? 

e) realizan las tres rotaciones, pero cada una de un ángulo de 180%? 

En el espacio Py de polinomios cúbicos, ¿qué matriz representa d?/d12? Construya la 


matriz de 4 por 4 a partir de la base estándar 1, t, 2, 1. Encuentre su espacio nulo y su 
espacio columna. ¿Qué significan éstos en términos de polinomios? 


De los cúbicos P, hasta los polinomios de cuarto grado Pa, ¿qué matriz representa la 
multiplicación por 2 + 31? Las columnas de la matriz A de 3 por 4 provienen de la 
aplicación de la transformación a 1, t, E 


Las soluciones de la ecuación diferencial 4?u/d1? = u forman un espacio vectorial (ya 
que las combinaciones de soluciones siguen siendo soluciones). Encuentre dos solu- 
ciones independientes, con la finalidad de obtener una base para ese espacio solución. 


Con valores iniciales u = x y du/dt = y en t = O, ¿qué combinación de los vectores 
en la base del problema 9 resuelve u” = u? Esta transformación de valores iniciales a 
solución es lineal. ¿Cuál es su matriz de 2 por 2 (usando x= 1,y=0yx=0,y=1 
como base de V, y su base de W)? 


Compruebe directamente a partir de c? + s? = 1 que las matrices reflexión satisfacen 


E? = 1, 

Suponga que A es una transformación lineal del plano x-y en sí mismo. ¿Qué hace 
ATMUx+y) = 47 x + 47!y?7SIiA está representada por la matriz M, explique por 
qué A”? está representada por M7! 


El producto (AB)C de transformaciones lineales empieza con un vector x y produce 
u = Cx. Luego, la regla 2V aplica AB a u y llega a (AB)Cx. 
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14, 
15. 


16. 


17. 


18. 


19, 


20. 


21. 


22 


R 


plo 
24, 


25, 


a) ¿Este resultado es el mismo si se aplican por separado C, luego B y por último A? 

b) ¿Este resultado es el mismo si se aplica BC seguido de A? Los paréntesis son inne- 
cesarios y la ley asociativa (AB)C = A(BC) se cumple para transformaciones linea- 
les. Esta es la mejor demostración de la misma ley para matrices. 


Demuestre que 7? es una transformación lineal si 7 es lineal (de R? a R?). 
El espacio de todas las matrices de 2 por 2 tiene los cuatro “vectores” en la base 


o or loo lor lo a) 


Para la transformación lineal de trasposición, encuentre su matriz A respecto a esta ba- 
se. ¿Por qué A? = /? 


Encuentre la matriz permutación cíclica de 4 por 4: (x,, Xx», X3, x4) se transforma en 
Ax = (2%, X3, X4, Xx1). ¿Cuál es el efecto de 47? Demuestre que 4? =A7?, 


Encuentre la matriz A de 4 por 3 que representa un desplazamiento derecho: (X;, Xx», 
x3) se transforma en (0, x¡, Xx», 43). También encuentre la matriz desplazamiento iz- 
quierdo B de R* de regreso a R”, transformando (x1, X2, X3, Xa) €N (%2, X3, X4). ¿Cuáles 
son los productos AB y BA? 


En el espacio vectorial Pz de todos los p(x) = ap + ax + azx? + azx?, sea S el sub- 


conjunto de los polinomios con 5 p(x) dx =0. Compruebe que $ es un subespacio 
y encuentre una base. 


Una transformación no lineal es invertible si 7(x) = b tiene exactamente una solución 
para toda b. El ejemplo si T(x) = 17 no es invertible porque 1? = b tiene dos solucio- 
nes para b positiva y ninguna solución para b negativa. ¿Cuáles de las siguientes trans- 
formaciones (de los números reales R! a los números reales R!) son invertibles? 
Ninguna es lineal, ni siquiera c). 


a Tm) =x. by TG) =e”. 
O TGO=x=>=ll. Dd) T(x) =cosx. 


¿Cuál es el eje y el ángulo de rotación para la transformación que lleva (x,, x>, x3) A 
(2, X3, x1)? 


Una transformación lineal debe dejar fijo al vector cero: T(0) = O. Demuestre esto a 
partir de Tv + w) = T(u) + T(w) escogiendo w = . También demuéstrelo a par- 
tir del requerimiento T(cv) = cT(u) escogiendo c = 





¿Cuáles de las siguientes transformaciones no son lineales? La entrada es y = (Uy, vz). 
a) T(v) ii (vz, U1). b) T(u) > Curs Ur). 
c) T(v) = (0,vy). d) T(v) =(0, 1). 


Si S y T son lineales con S(u) = T(v) = v, entonces ¿S(T(v)) = vo v?? 


Suponga que 7(v) = v, excepto que T(0, v,) = (0, 0). Demuestre que esta transforma- 
ción satisface T(cv) = cT(u) pero no Tu + w) = T(v) + Tíw). 


¿Cuáles de las siguientes transformaciones satisfacen T(v + w) = T(v) + T(w), y cuá- 
les satisfacen T(cv) = cT(u)? 


a) Tí) = y llull. by T(v) =41, +u +u. 
cd) T(1) = (1,, 2u2, 313). d) T(u) = la mayor componente de v. 
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26. Para las siguientes transformaciones de V = R* en W = R?, encuentre T(T(v). 
A TN) = —v. 
D TN) =vw>+(1 1). 
c) T(v) = 00" rotación = (—vus,v;y). 

e 1 2) 


dE = 1Án = ( : 
d) (vu) = proyección > > 


TES 


27. La transformación “cíclica” T' se define por T(v,, Uv», U3) = (Uz, Uz, Uy). ¿Cuál es 
T(T(T(W))? ¿Cuál es Ty)? 


28. Encuentre el contradominio y el kernel (estos términos son nuevos para designar el es- 
pacio columna y el espacio nulo) de T. 


a) T(vuj,v2) = lv2,v1). b) T(uv1, va, us) = (u;, vz). 
c) T(v,,v2) = (0, 0). d) T(uv;,va2) = (v1, 41). 


29. Una transformación lineal de V a W tiene una inversa de W a V cuando el contrado- 
minio €s todo W y el kernel sólo contiene a v = O. ¿Por qué estas transformaciones 
no son invertibles? 

a) T(v;,v2) = (vz, ua) W =R?. 
by) Tív;,v2) = (Uv, 02,81 + vu) W =R?, 
c) T(vi,v2) = 1 W =R!. 


30. Suponga que una T lineal transforma (1, 1) en (2, 2) y (2, 0) en (0, 0). Encuentre Tu) 
cuando 


4 4e02,2. bb 0=08B.D. ¿€ vu =(+71,D. d) v =l(a,0b). 


Los problemas 31 a 35 pueden ser más difíciles. El espacio de entrada V contiene a to- 
das las matrices M de 2 por 2, 


31. Mes cualquier matriz de 2 por2 y A = > 2]. La transformación lineal T se define 


como T(M) = AM. ¿Cuáles reglas de la multiplicación de matrices muestran que Tes 
lineal? 
32. Suponga que Á = E al . Demuestre que la matriz identidad / no está en el contra- 


dominio de 7. Encuentre una matriz M diferente de cero tal que T(M) = AM es cero. 


33. Suponga que T transpone a toda matriz M. Intente encontrar una matriz A que haga 
AM = M? para toda M. Demuestre que ninguna matriz A puede hacer lo anterior. Pa- 
ra los profesores: ¿Esta es una transformación lineal que no proviene de una matriz? 


| 
| 
34. La transformación T que transpone a toda matriz es definitivamente lineal. ¿Cuáles de 
las siguientes propiedades adicionales son ciertas? 
a) T? = transformación identidad. 
. b) El kernel de T es la matriz cero. 
c) Todas las matrices están en el contradominio de T. 


dy TIM) = —M es imposible. 
35. Suponga que T(M) = E Al UM | E A Encuentre una matriz con T(M) + O. 


Describa todas las matrices con T(M) = 0 (el kernel de 7) y todas las matrices de sa- 
lida T(M) (el contradominio de 7). 
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Los problemas 36 a 40 son sobre cambio de base. 


36. 


E 


38. 


E 


40. 


41. 


42 


43. 


45. 


46. 


47. 


43. 


a) ¿Qué matriz transforma (1, 0) en (2, 5) y (0, 1) en (1, 3)? 
b) ¿Qué matriz transforma (2, 5) en (1, 0) y (1, 3) en (0, 1)? 
c) ¿Por qué ninguna matriz transforma (2, 6) en (1, 0) y (1, 3) en (0, 1)? 


a) ¿Qué matriz M transforma (1, 0) y (0, 1) en (r, £) y (s, u1)? 
b) ¿Qué matriz N transforma (a, c) y (b, d) en (1, 0) y (0, 1)? 
Cc) ¿Qué condición sobre a, b, c, d hace imposible el inciso b)? 


a) ¿Cómo M y N del problema 37 producen una matriz que transforma (a, c) en (r, 1) 


y (b, d) en (s, u)? 
by ¿Qué matriz transforma (2, 5) en (1, 1) y (1, 3) en (0, 2)? 


Si se conservan los mismos vectores en la base pero se escriben en otro orden, la ma- 
triz de cambio de base M es una matriz . Si los vectores en la base se preservan 
en orden pero se cambian sus longitudes, entonces M es una matriz 








La matriz que transforma (1, 0) y (0, Den (1,4 y (1, 5 es M = . La combina- 
ción a(1, 4) + b(1, 5) igual a (1, 0) tiene (a, b) = (, ). ¿Cómo se relacionan estas coor- 
denadas de (1, 0) con MoM”*? 

¿Cuáles son las tres ecuaciones para A, B, C si la parábola Y = A + Bx + Cx” es igual 


a4denx=a ñ5enx= b, y 6 en x = c? Encuentre el determinante de la matriz de 3 
por 3, ¿Para qué números a, b, c es imposible encontrar esta parábola Y? 


Suponga que v;, Va, U3 SON vectores característicos para 7. Esto significa que T(v;) = 
A¡v; para i = 1, 2, 3. ¿Cuál es la matriz para 7 cuando las bases de entrada y de salida 
son las vs? 


Toda transformación lineal invertible puede tener a J como su matriz. Para la base de 
salida se elige w, = 7(u,). ¿Por qué 7 debe ser invertible? 


Suponga que T' es una reflexión a través del eje x y que $ es una reflexión a través del 
eje y. El dominio Y es el plano x-y. Si v = (x, y), ¿cuál es SG(u))? Encuentre una des- 
cripción más sencilla del producto S7. 


Suponga que 7 'es una reflexión a través de la recta a 45%, y que S es una reflexión a 
través del eje y, Si v = (2, 1), entonces T(v) = (1, 2). Encuentre Sw) y T(S(v)y. Con 
esto se demuestra que en general ST * TS. 


Demuestre que el producto $7 de dos reflexiones es una rotación. Multiplique estas 
matrices reflexión para encontrar el ángulo de rotación: 


cos 28 sen 20 cos 2 sen 24 
sen28  —cos 20 sen2a —cos2x]' 


La matriz de Hadamard de 4 por 4 está integrada completamente por +1 y —1: 
1 1 Po 


1-1. 1-1 
| 1 —-1 -—1| 
1-1 -1 1 


Encuentre 47? y escriba v = (7, 5, 3, 1) como una combinación de las columnas de H. 


Suponga que se tienen dos bases U;,..., Un Y Wj, -. - , W, de R”. Si un vector tiene coe- 
ficientes b, en una base y c, en la otra base, ¿cuál es la matriz de cambio de base en 


| 
| 
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50. 
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b = Mc? Empiece con. > HERA Bozi NA 
Di01 + +++ FbanUn = VO = Cc; ++ ** FC. = We. 


Su respuesta representa T(v) = uv con base de entrada de us y base de salida de ws. De- 
bido a que las bases son distintas, la matriz no es /. 


¿Falso o verdadero? 51 se conoce T(u) para n vectores diferentes de cero en R”, enton- 
ces se conoce 7(v) para cada vector en R”, 


(Recomendado) Suponga que todos los vectores x en el cuadrado unitario 0 E x, = 1, 
O <= x2 = 1 se transforman en Ax (A es de 2 por 2). 

a) ¿Cuál es la forma de la región transformada (toda Ax)? 

b) ¿Para qué matrices A esta región es cuadrada? 

c) ¿Para qué matrices A es una recta? 

d) ¿Para qué matrices A la nueva área sigue siendo 1? 


Ed Ejercicios de repaso 


2.1 


2.2 


2 


2.4 


25 


Encuentre una base para los siguientes subespacios de R*: 


a) Los vectores para los cuales x, = 2x4. 
b) Los vectores para los cuales xy + x2 +x3=0yx3 + x4=0. 
c) El subespacio generado por (1, 1, 1, 1), (1, 2,3, 4), y (Q, 3, 4, 5). 


Proporcione una base para describir un subespacio bidimensional de R* que no con- 
tenga ninguno de los vectores de coordenadas (1, 0, 0), (O, 1, 0), (O, 0, 1). 


¿Falso o verdadero? Proporcione un contraejemplo si es falso: 

a) Si los vectores X;,..., Xx, generan un subespacio $, entonces dim S = m. 

b) La intersección de dos subespacios de un espacio vectorial no puede ser vacía. 

Cc) Si Ax = Ay, entonces x = y. 

d) El espacio renglón de A tiene una base única que puede calcularse reduciendo A 
a forma escalonada. 

e) Si una matriz cuadrada A tiene columnas independientes, también A* tiene co- 
lumnas independientes. 


¿Cuál es la forma escalonada U de A? 


1 Z 0 de 1 
A=1i=1 -2 1 1 01. 
1 e 


¿Cuáles son las dimensiones de sus cuatro subespacios fundamentales? 


Encuentre el rango y el espacio nulo de 


020.31 000 12 
a=|0 0 1 y B=|0 0 1 2 
e 0 


> — rr asc 
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2.6 Encuentre bases para los cuatro subespacios fundamentales asociados con 


Ra _fo.0 E OO 
4=| Al p=' 4, c= |; 10 i 


2.7 ¿Cuál es la solución más general de u + v + w= l, u — w= 2? 


2.8 a) Construya una matriz cuyo espacio nulo contenga al vector x = (1, 1, 2). 
b) Construya una matriz cuyo espacio nulo izquierdo contenga a y = (1, 5). 
c) Construya una matriz cuyo espacio columna sea generado por (1, 1, 2) y cuyo 
espacio renglón sea generado por (1, 5). 
d) Si se tienen tres vectores cualesquiera en R* y tres vectores cualesquiera en R?, 
¿existe alguna matriz de 6 por 5 cuyo espacio columna es generado por los pri- 
meros tres y cuyo espacio renglón es generado por los segundos tres? 


2.9 Enel espacio vectorial de matrices de 2 por 2, 
a) ¿el conjunto de matrices con rango 1 es un subespacio? 
b) ¿qué subespacio es generado por las matrices permutación? 
c) ¿qué subespacio es generado por las matrices positivas (todos los ay; > 0)? 
d) ¿qué subespacio es generado por las matrices invertibles? 


' ' ; te y.” ¿ Loa a A sd 
ls 

SÁ 

El 


2.10 Invente un espacio vectorial que contenga a todas las transformaciones lineales de 
R” a R”. Defina una regla para la suma. ¿Cuál es la dimensión del espacio vecto- 
rial? 


2.11 a) Encuentre el rango de A, y proporcione una base de su espacio nulo. 


1 LO 2 
e E 0 A 0 O 
0 OOO Or iO ul 
dodo el O “0 POSO 05 10 
b) Los 3 primeros renglones de U son una base del espacio renglón de A: ¿falso o 
verdadero? 
Las columnas 1, 3, 6 de U son una base del espacio columna de A: ¿falso o ver- 
dadero? 
Los cuatro renglones de A son una base del espacio renglón de A: ¿falso o ver- 
dadero? 


c) Encuentre tantos vectores b linealmente independientes como sea posible para 
los cuales Ax = b tenga una solución. 

d) En la eliminación sobre A, ¿qué múltiplo del tercer renglón se restó para elimi- 
nar el cuarto renglón? 


2.12 SiA es una matriz de n por n —- 1, y su rango es n — 2, ¿cuál es la dimensión de su 
espacio nulo? 


2.13 Use eliminación para encontrar los factores triangulares en A = LU, si 


a atada 

PO CA 
do ble 6 
a bed 


¿Qué condiciones deben imponerse a los números a, b, c, d para que las columnas sean li- 
nealmente independientes? 


de iS 
ALDO Y E A Se U e k 
NN de 
' % 
: po, 
toi E as q o 





2.14 
2.15 


2.16 
2.17 
2.18 
2.19 


2.20 


2.21 


2.22 


2.23 


2.24 


2.25 


2.26 
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¿Los vectores (1, 1, 3), (2, 3, 6), y (1, 4, 3) son una base de R3? 


¿Qué se sabe de C(4) cuando el número de soluciones de Ax = bes 
a) Do 1, dependiendo de b. 

b) co, independientemente de b. 

c) Do co, dependiendo de b. 

dy 1, sin importar b. 


En el ejercicio anterior, ¿cómo está relacionado r con m y n en cada ejemplo? 
Si x es un vector en R”, y x*y = 0 para toda y, demuestre que x = O. 
Si A es una matriz de n por n tal que A? = A y rango A = n, demuestre que A = 1. 


¿Qué subespacio de matrices de 3 por 3 es generado por las matrices elementales 
E, con 1s en la diagonal y cuando mucho un elemento diferente de cero debajo de 
la diagonal? 


¿Cuántas matrices permutación de 5 por 53 hay? ¿Son linealmente independientes? 
¿Generan el espacio de todas las matrices de 3 por 5? No es necesario que las escri- 
ba todas. 


¿Cuál es el rango de la matriz de n por n con todos los elementos igual a 1? ¿Qué 
puede decir sobre la “matriz de tablero de ajedrez”, con ay = O cuando i + jes par, 
aj = 1 cuando ¿ + jes impar? 


a) ¿Qué condiciones deben imponerse a b para que Ax = b tenga una solución, pa- 
ra las siguientes A y b? 


OS by 
O: A PO | b3 


b) Encuentre una base para el espacio nulo de A. 

c) Encuentre la solución general de Ax = bh, cuando exista una solución. 
d) Encuentre una base para el espacio columma de A. 

e) ¿Cuál es el rango de A*? 


¿Cómo puede construirse una matriz que transforme los vectores de coordenadas €, 
e», € en tres vectores dados Uy, Uz, V3? ¿Cuándo es invertible esa matriz? 


Si €,, €,, ez están en el espacio columna de una matriz de 3 por 5, ¿ésta tiene inver- 
sa izquierda? ¿Tiene inversa derecha? 


Suponga que T es una transformación lineal sobre R? que transforma cada punto (u, 
v, w)en lu + uv + w, u + vu, u). Describa lo que 7”? hace al punto (x, y, z). 


¿Falso o verdadero? 

a) Todo subespacio de R* es el espacio nulo de alguna matriz. 

b) Si A tiene el mismo espacio nulo que A*, entonces la matriz debe ser cuadrada. 
c) La transformación que manda x a mx + b es lineal (de R' aR!). 


2.27 Encuentre bases para los cuatro subespacios fundamentales de 


LO E 
0222 

zz a 4 

A O A 
o ota 
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2.23 


2.29 


2.30 


2.31 
2.32 


2.33 


a) Silos renglones de A son linealmente independientes (4 es de m por n), entonces 
el rango es , €l espacio columna es y el espacio nulo izquierda es ____. 

b) Si A es de 8 por 10 con un espacio nulo bidimensional, demuestre que Ax = b 
puede resolverse para toda b. 








Describa las transformaciones lineales del plano x-y que están representadas con la 
base estándar (1, 0) y (0, 1) por las matrices 


1 0 1.0 o 1 
a= lo 3) As = ie Ar = |; el 


a) Si A es cuadrada, demuestre que el espacio nulo de 4* contiene al espacio nulo 
de A. 

b) También demuestre que el espacio columna de A? está contenido en el espacio 
columna de A. 


¿Cuándo se cumple 4? = O para la matriz A = uv* de rango 1? 


a) Encuentre una base para el espacio de todos los vectores en R* con x, + x, = 
Xa FX Xs TX 

by) Encuentre una matriz cuyo espacio nulo sea ese subespacio. 

c) Encuentre una matriz cuyo espacio columna sea ese subespacio. 


Suponga que las matrices PA = LU son 


E A E E 
A A E 
0.0.0 1| [4 -2 9 4 
00 1 0112 1 5 1 5 
E E Es O E 
_jo 100 lo 0 1-3 2 
LE O os 0: 0. +07 2 
2 101fjo 0.0 0.0 


a) ¿Cuál es el rango de A? 

b) ¿Cuál es una base para el espacio renglón de A? 

c) ¿Falso o verdadero?: Los renglones 1, 2, 3 de A son linealmente independientes. 
d) ¿Cuál es una base para el espacio columna de A? 

e) ¿Cuál es la dimensión del espacio nulo izquierdo de 4? 

$) ¿Cuál es la solución general de Ax = 0? 
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Y Ortogonalida 


3.1 VECTORES Y SUBESPACIOS ORTOGONALES 


Una base es un conjunto de vectores independientes que genera un espacio. Geométrica- 
mente, es un conjunto de ejes coordenados. Un espacio vectorial se define sin estos ejes, 
aunque cada vez que pienso en el plano x-y, en el espacio tridimensional o en R”, ahí es- 
tán los ejes. ¡Suelen ser perpendiculares! Los ejes coordenados producto de la imaginación 
prácticamente siempre son ortogonales. Al elegir una base, se tiende a elegir una ortogo- 
nal. 

Uno de los fundamentos del álgebra lineal es el concepto de base ortogonal. Se re- 
quiere una base para convertir construcciones geométricas en cálculos algebraicos, y se 
necesita una base ortogonal para que estos cálculos sean sencillos. Especialización más 
detallada hace casi Óptima la base: los vectores deben tener longitud 1. Para una base or- 
tonormal (vectores unitarios ortogonales) se encuentra que 


1. lalongitud |lxi| de un vector; 
2. la prueba x*y = 0 para vectores perpendiculares; y 
3. cómo crear vectores perpendiculares a partir de vectores linealmente independientes. 


Más que justamente vectores, los subespacios también pueden ser perpendiculares. Se 
descubrirá, de manera tan hermosa y simple que será una delicia ver, que los subespacios 
fundamentales se encuentran a ángulos rectos. Estos cuatro subespacios fundamentales 
son perpendiculares por pares, dos en R” y dos en R”. Esto completará el teorema funda- 
mental del álgebra lineal, 

El primer paso es encontrar la longitud de un vector, que se denota por [[x||, y en 
dos dimensiones proviene de la hipotenusa de un triángulo rectángulo (véase la figura 
3.14). El cuadrado de la longitud fue proporcionado hace mucho tiempo por Pitágoras: 
lx? =x? + x2. | 
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(Das (1, 2,0) tiene longitud V5 


Figura 3.1 Longitud de los vectores (x;, x2) Y (X], X2, X3). 
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En el espacio tridimensional, x = (x,, x2, x3) es la diagonal de una caja (véase la figu- 
ra 3.15). Su longitud proviene de dos aplicaciones de la fórmula de Pitágoras. El caso bi- 
dimensional se ocupa de (x,, X2, 0) = (1, 2, 0) a través de una base. Esto forma un ángulo 
recto con el lado vertical (0, 0, x3) = (0, 0, 3). La hipotenusa del triángulo en negritas (nue- 
vamente Pitágoras) es la longitud |lxl| que se busca: 


Longitud en 3 dimensiones xl? =1?*+22+3% y lll == 4x2? +32 + x2. 


La extensión ax = (x;, .. . , x,) en n dimensiones es inmediata. Por el teorema de Pi- 
tágoras multiplicado por n — 1 veces, la longitud de |lx]| en R” es la raíz cuadrada positi- 
T 
va de x*x: 


A A PS ri" 
+ e 


(1) 





Longitud al cuadrado :. (lxIl? 5 


La suma de cuadrados corresponde a x*x, y la longitud de x = (1,2, —3)es Y/14: 
] 


o a A a. 
3 


Vectores ortogonales 


¿Cómo decidir si dos vectores x y y son perpendiculares? ¿Cuál es la prueba de ortogona- 
lidad en la figura 3.2? En el plano generado por x y y, estos vectores son ortogonales en el 
supuesto de que formen un triángulo rectángulo. Volvamos a a? + b? = e?: 


Lados de un triángulo rectángulo — [lx11? + [ly II? = (lx — y11?. 2) 
Al aplicar la fórmula de la longitud (1), esta prueba de ortogonalidad en R” se vuelve 
A O RE O OA 
El miembro derecho contiene un término —2x; y, extra de cada (x, — y,)?: 
miembro derecho —= (xi +++ +x2) — Loy +++ +xnya) + (y? + > + y?). 


Se tiene un triángulo rectángulo cuando la suma de los términos del producto cruz X; y; es 
cero: 


(3) 


Vectores ortogonales 





Esta sumatoria es xy = Y x, y, = y*x, el vector renglón x* multiplicado por el vector co- 
humna y: 


Y1 
Producto interno xy =[x, ... a) |] =xu1)9 +- tx). (4) 


Yn 


' 
| 
¡ 
) 
1 
) 
1 
| 
J 


sio? 
EA 


delay 


Ejemplo 1 
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Ángulo recto 
ay =0 







pe 1/25 pe 
E 


aTy=0 SUSO o x*y>0 
mayor que 90” ; . menor que 90? 


Figura 3.2 Triángulo rectángulo con 5 + 20 = 25. Ángulo con línea punteada 100", án- 
gulo con línea discontinua 30*. 


Algunas veces este número se denomina producto escalar o producto punto, y se denota por 
(x, y) O x - y. Aquí se usará el nombre de producto interno y se preservará la notación x*y. 





La longitud al cuadrado es el producto interno de x consigo mismo: x1x =x*f+ +++ + 
x2 = l|x[[?. El único vector con longitud cero —el único vector que es ortogonal a sí 
mismo— es el vector cero. Este vector x = O es ortogonal a cada vector en R”. 


(2, 2, —1) es ortogonal a (— 1,2, 2). La longitud de cada uno es Y4+4+1=3, 


Hecho útil: Si los vectores diferentes de cero v;,..., 1, Son mutuamente ortogonales 
(cada vector es perpendicular a los demás), entonces estos vectores son linealmente in- 
dependientes. 


Demostración Suponga que C,v; + + ** + CgUz = 0. Para demostrar que c, debe ser cero, 
se toma el producto interno de ambos miembros con v,. Debido a la ortogonalidad de las 
vs, se queda con un solo término: 


vi (cv; Hoc. + Cu) = CIU; = 0. (5) 


Los vectores son diferentes de cero, de modo que viv, 4 O y en consecuencia c, = 0, 
Lo mismo se cumple para cada c,. La única combinación de las vs que produce Ó tiene a 
todas las c; = 0: ¡independencia! Ex 


Los vectores coordenados e€;,..., e, en R” son los vectores ortogonales más impor- 
tantes. Éstos son las columnas de la matriz identidad. Constituyen la base más sencilla de 
R”, y son vectores unitarios: la longitud de cada uno es lle, || = 1. Apuntan a lo largo de los 
ejes de coordenadas. Si estos vectores se rotan, el resultado es una nueva base ortonor- 
mal: un nuevo sistema de vectores unitarios mutuamente ortogonales. En R? se tiene cos” 
0 + sen? O = 1: 


Vectores ortonormales en R? v, = (cos 6, sen 0) y va, = (—sen 0, cos 6). 


Subespacios ortogonales 


A continuación se abordará la ortogonalidad de dos subespacios. Cada vector en un subes- 
pacio debe ser ortogonal a cada vector en el otro subespacio. Los subespacios de R* pue- 
den tener dimensión O, 1, 2, o 3. Estos subespacios están representados por rectas o planos 
que pasan por el origen, y en casos extremos, sólo por el origen o todo el espacio. El 
subespacio [0) es ortogonal a todos los subespacios. Una recta puede ser ortogonal a otra 
recta, o puede ser ortogonal a un plano, pero un plano no puede ser ortogonal a un plano. 
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Ejemplo 2 


Debo admitir que el muro frontal y el muro lateral de una habitación se ven como pla- 
nos perpendiculares en R?. Pero según nuestra definición, ¡no es así! Hay rectas v y wen 
los muros frontal y lateral que no se encuentran a ángulos rectos. La recta que corre a lo 
largo de la arista pertenece a ambos muros, y ciertamente no es ortogonal a sí misma. 








38. ¿Dos Subespacios y. y w dela mismo espacio io RA SOM: ortogonales si cada vecto 


10) en Ad es 5 ortogonal e a Sada vector 1 w en. ME = Q para toda y y w 
Suponga que V es el plano generado por ví, = (1, 0, 0, 0) y uv, = (1, 1, 0, 0). Si W es el 
plano generado por w = (0, O, 4, 5), entonces w es ortogonal a ambos vectores vs. La rec- 
ta W es ortogonal a todo el plano V. 


En este caso, con subespacios de dimensiones 2 y 1 en R”, hay espacio para un tercer 
subespacio. La recta L que pasa por z = (0, 0, 5, —4) es perpendicular a V y W. Así, la su- 
ma de las dimensiones es 2 + 1 + 1 = 4, ¿Qué espacio es perpendicular a los tres, V, W, 
y L? 


Los importantes subespacios ortogonales no se presentan accidentalmente, y se pre- 
sentan por pares. De hecho, los subespacios ortogonales son inevitables: ¡Son los espacios 
fundamentales! El primer par lo constituyen el espacio nulo y el espacio renglón. Estos 
son subespacios de R”: los renglones tienen 1 componentes, como el vector x en Ax = 0, 
Es necesario demostrar, usando Ax = 0, que los renglones de A son ortogonales al vector 
x en el espacio nulo. 





el s ¿0 
RA RA E AS 


Primera demostración Suponga que x es un vector en el espacio nulo. Entonces Ax = 0, y 
este sistema de m ecuaciones puede escribirse como renglones de A que multiplican a x: 


P *1 
h - renglón1  --.. e 0 
Todo renglón es ar | oe renglón 2 ---| 1%] _ Jo (6 
ortogonal a x 4 : 
«renglón m ++] |. 0 
” 


La cuestión importante ya está presente en la primera ecuación: el renglón 1 es orto- 
gonal a x. Su producto interno es cero: esaes la ecuación 1. Todo miembro derecho es ce- 
ro, de modo que x es ortogonal a todo renglón. En consecuencia, x es ortogonal a toda 
combinación de los renglones. Cada x en el espacio nulo es ortogonal a cada vector en el 
espacio renglón, de modo que N(4) L C(AB. 

El otro par de subespacios ortogonales proviene de Ay =0,oy'A =0: 


E OSO. (7 


pd [FA 
3 As -— 200 


El vector y es ortogonal a cada columna. La ecuación así lo indica, a partir de los ceros en 
el miembro derecho. En consecuencia, y es ortogonal a toda combinación de las columnas. 
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Ejemplo 3 
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Es ortogonal al espacio columna, y se trata de un vector típico en el espacio nulo izquier- 
do: N(AB) 1 C(A). Esto es lo mismo que la primera mitad del teorema, con A sustitui- 
da por A*. da 


Segunda demostración El contraste con esta “demostración libre de coordenadas” debe ser 
de utilidad para el lector. Constituye un método de razonamiento más “abstracto”. Me gus- 
taría saber cuál de las dos demostraciones es más clara y mejor comprendida. 

Si x está en el espacio nulo, entonces Ax = O. Si y está en el espacio renglón, es una 
combinación de los renglones: v = A*z para algún vector z. Así, en una línea: 


Espacio nulo -L Espacio renglón yx =(ATy"x =FAx=Z%0=0. (8) 
E 


Suponga que el rango de A es 1, de modo que su espacio columna y su espacio renglón son 
rectas: 


1 3 
Matriz de rango 1 A=|2 6]. 
a 


Los renglones son múltiplos de (1, 3). El espacio nulo contiene a x = (—3, 1), que es orto- 
gonal a todos los renglones. El espacio nulo y el espacio renglón son rectas perpendicula- 
res en R?: 


[1 7 [3-0 A [2 6] HE y [9 o 


En contraste, los otros dos subespacios están en R?. El espacio columna es la recta que pa- 
sa por (1, 2, 3). El espacio nulo izquierdo debe ser el plano y, + 2y2 + 3y3 = 0. Esta ecua- 
ción es exactamente el contenido de yYA = 0. 


Los dos primeros subespacios (las dos rectas) tienen dimensiones 1 + 1 = 2 en el es- 
pacio R?. El segundo par (recta y plano) tienen dimensiones 1 + 2 = 3 en el espacio R?. 
En general, el espacio renglón y el espacio nulo tienen dimensiones cuya suma es r + (n-— 
r) = n. La suma de las dimensiones del otro par es igual a r + (m-— r) = m. Está ocurrien- 
do algo más que la ortogonalidad, por lo que pido paciencia al lector para abordar otra cues- 
tión adicional: las dimensiones. 

Con toda certeza es verdad que el espacio nulo es perpendicular al espacio renglón, 
aunque ésta no es toda la verdad. N(A) contiene a todo vector ortogonal al espacio ren- 
glón. El espacio nulo fue formado a partir de todas las soluciones de Ax = O. 


DEFINICIÓN Dado un subespacio V de R”, el espacio de todos los vectores ortogonales 
a Y se denomina complemento ortogonal de V. Se denota por Y =“V perp.” 


Con esta terminología, el espacio nulo es el complemento ortogonal del espacio ren- 
glón: N(A) = (C(AF))+, Al mismo tiempo, el espacio renglón contiene a todos los vec- 
tores que son ortogonales al espacio nulo. Un vector z no puede ser ortogonal al espacio 
nulo sino fuera del espacio renglón. Al agregar z como un renglón extra de A se agranda el 
espacio renglón, aunque se sabe que hay una fórmula fija r + (n-r)= nm: 


Fórmula de la dimensión dim(espacio renglón) + dim(espacio nulo) = número de 
columnas. 


Todo vector ortogonal al espacio nulo está en el espacio renglón: C( AS) =(N(AD?. 
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El mismo razonamiento aplicado a A* produce el resultado dual: El espacio nulo iz- 
quierdo N(A?) y el espacio columna C(A) son complementos ortogonales. La suma de sus 
dimensiones es igual a (m-— r) + r = m. Esto completa la segunda mitad del teorema fun- 
damental del álgebra lineal. La primera mitad proporcionó las dimensiones de los cuatro 
subespacios, incluyendo el hecho de que rango renglón = rango columna. Ahora se sabe 
que estos subespacios son perpendiculares. Más que eso, los subespacios son complemen- 
tos OE ES 








3D | Teorema , fundamental d del A álgebra li lineal, : , parte md E 





A El espacio sul es el om iemeñto ortogonal del espacio ON en Rp” A 

El FEO e OS es a at a del lod cos en ex Es 
Para ser sl espacio one contiene bdo lo que es SODA: al espacio nula! El espa- 
cio columna contiene todo lo que es ortogonal al espacio nulo izquierdo. Esta es sólo una 
oración, escondida a medio libro, pero ¡decide cuáles ecuaciones pueden resolverse! Si se 
mira directamente, Áx = bh requiere que b esté en el espacio columna. Si se mira indirecta- 
mente, Ax = b peqtllere que bh sea e al spa nulo E 


OSO a E ¿aa e. E O 
Ñ ¿ EOS APS e Me Ñ 
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s resoluble. si y y sólo si 0 .= 0, siempre que, y ya = 0. 
El método directo fue “b debe ser una combinación de las columnas”. El método indirecto 
es “b debe ser ortogonal a cada vector ortogonal a las columnas”. Esto no se ve como una 
mejoría (para plantearlo en términos suaves). Pero si sólo uno o dos vectores son ortogona- 
les a las columnas, resulta mucho más fácil comprobar estas una o dos condiciones y* 

O. Un buen ejemplo es la ley del voltaje de Kirchhoff en la sección 2.5. Verificar cero alre- 
dedor de los circuitos es mucho más fácil que reconocer combinaciones de las columnas. 


Cuando la suma de los miembros izquierdos de Ax =b es cero, entonces los miem- 
bros derechos también tienen que cumplir lo siguiente: 


Ai AS =b, l =4 O 
x2 — Xx3 = ba es resoluble si y sólo si b; + b2 +b3=0. Aquí A =| O l -—1 
A bx | 0 1 


Esta prueba b, + bz + b3 = 0 hace que b sea ortogonal a y = (1, 1, 1) en el espacio nulo 
izquierdo. Por el teorema fundamental, ¡b es una combinación de las columnas! 


La matriz y los subespacios 


Se recalca que V y W pueden ser ortogonales sin ser complementos. Sus dimensiones tam- 
bién pueden ser pequeñas. La recta V generada por (O, 1, 0) es ortogonal a la recta W ge- 
nerada por (0, O, 1), pero V no es W*. El complemento ortogonal de W es un plano 
bidimensional, y la recta es sólo parte de W+. Cuando las dimensiones están correctas, los 
subespacios ortogonales son necesariamente complementos ortogonales. 


Si W = V*, entonces V = W- y dim V + dim W = n. 


En otras palabras, V+“ = V. Las dimensiones de V y W están correctas, y todo el espacio 
R” se ha descompuesto en dos partes perpendiculares (véase la figura 3.3). 
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W W 


Dos ejes ortogonales en R* Recta W perpendicular al plano V 
No son complementos ortogonales Complementos ortogonales V = W+ 


> 





Figura 3.3 Complementos ortogonales en R”: un plano y una recta (no dos rectas). 


Al separar R” en dos partes ortogonales, cada vector se separa en x = vu + w. El vec- 
tor v es la proyección sobre el subespacio V. La componente ortogonal w es la proyección 
de x sobre W. En la siguiente sección se muestra cómo encontrar estas proyecciones de x. 
Éstas conducen a lo que quizá es la figura más importante del libro (véase la figura 3.4). 

En la figura 3.4 se resume el teorema fundamental del álgebra lineal. Hustra el verda- 
dero efecto de una matriz: lo que ocurre al interior de la multiplicación Ax. El espacio nu- 
lo es llevado al vector cero. Todo Ax está en el espacio columna, Nada se manda al espacio 
nulo izquierdo. La verdadera acción es entre el espacio renglón y el espacio columna, y el 
lector verá esto al analizar un vector típico x. Éste contiene una “* componente del espacio 
renglón” y una “componente del espacio nulo”, con x = x,. + x,. Cuando esto se multipli- 
ca por A, se trata de Ax = Ax, + Ax,: 


La componente del espacio nulo se va en cero: Ax, = 0. 
La componente del espacio renglón se va al espacio columna: Ax, = Ax. 


Por supuesto, todo va al espacio columna: la matriz no puede hacer otra cosa. He intenta- 
do hacer los espacios renglón y columna del mismo tamaño, con dimensión igual r. 





dim r 









espacio Tr 
renglón 
de Á 






Figura 3.4 La verdadera acción Ax = A(rengión Y Ynuto) de cualquier matriz de m por n. 


E A ADD 
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Demostración Todo b en el espacio columna es una combinación Ax de las columnas. De 
hecho, b es Ax,, con x, en el espacio renglón, ya que la componente del espacio nulo da 
Ax, = 0. Si otro vector x” en el espacio renglón proporciona Ax' = b, entonces Á(x, — 
x,) =b=—b =0. Esto coloca a x, — x; en el espacio nulo y en el espacio renglón, lo cual 
lo hace ortogonal a sí mismo. En consecuencia, es cero, y x, = x/. Exactamente un vector 
en el espacio renglón es llevado a b. El 


Toda matriz transforma su espacio renglón sobre su espacio columna. 


Sobre estos espacios r-dimensionales, A es invertible. Sobre su espacio nulo, A es cero. 
Cuando A es diagonal, se observa que la submatriz invertible preserva los r no ceros. 

A” va en dirección opuesta, de R” a R” y de C(4) de vuelta a C(4%). Por supuesto, ¡la 
traspuesta no es la inversa! A* mueve correctamente los espacios, pero no los vectores in- 
dividuales. Este honor corresponde a A”! en caso de existir, y sólo existe si r = m = n. No 
puede pedirse que A”? regrese todo un espacio nulo a partir del vector cero. 

Cuando A”? no existe, el mejor sustituto es la seudoinversa A*. Esta matriz invierte A 
donde es posible hacerlo: AT Ax = x para x en el espacio renglón. Sobre el espacio nulo iz- 
quierdo, nada puede hacerse: ATy =0. Así, A* invierte A cuando ésta es invertible, y tiene 
el mismo rango r. Una fórmula para A* depende de la descomposición del valor singular, 
tema para el cual antes se requiere saber algo sobre valores característicos (o singulares). 


E 
á 
E 
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dl Conjunto de problemas 3,1 


1. Encuentre las longitudes y el producto interno de x = (1, 4,0, 2) y y = (2, —2, 1, 3). 


2. Proporcione un ejemplo en R* de vectores linealmente independientes que no sean or- 
togonales. También, proporcione un ejemplo de vectores ortogonales que no sean in- 
dependientes. 


TRAAAT ITUAP ARAN LIPITOR E IMT) PEPA DAVID TOROS EA AROS E REDIRIESIAS IA ADORAN E ALIAS BUS 


3. Dos rectas en el plano son perpendiculares cuando el producto de sus pendientes es 
—1. Aplique este hecho a los vectores x = (x,, xa) y y = (1, ya), cuyas pendientes son 
x2/x1 y Ya /y 1, para deducir nuevamente la condición de ortogonalidad x*y = O. 

4. Cómo puede saberse si el ¿-ésimo renglón de una matriz invertible B es ortogonal a la 
j-ésima columna de B"!siik /? 

5. Delos siguientes vectores, U¡, Vz, Vz, Va ¿QUÉ pares son ortogonales? 


URAC 01007207017 ta TO RRA O API LO 


1 + 1 1 

vi a O ds . e E q A ; 
pos 4 ul 1 

1 0 E. 1 


6. Encuentre todos los vectores en R* que son ortogonales a (1, 1, 1) y (1, —1, 0). Escri- 
ba una base ortonormal a partir de estos vectores (vectores unitarios mutuamente or- 
togonales). 


7. Encuentre un vector x ortogonal al espacio renglón de A, un vector y ortogonal al es- 
pacio columna, y un vector z ortogonal al espacio nulo: 


var mg ir RL A RR IIA A ALS IA GT 0 A 


pia 1 
A=4142 4 3 
31564 


a mu PP e 


. no + 


la 
unid 


10. 


11. 


12. 


13. 


14. 
15, 


16. 
17. 


18. 


19. 


2d 


22. 
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Si V y W son subespacios ortogonales, demuestre que el único vector que tienen en 
común es el vector cero: Y NM W = (0). 


Encuentre el complemento ortogonal del plano generado por los vectores (1, 1, 2) y 
(1, 2, 3), considerando que son los renglones de A y resolviendo Ax = O, Recuerde que 
el complemento es toda una recta. 


Escriba una ecuación homogénea en tres incógnitas cuyas soluciones sean la combi- 
nación lineal de los vectores (1, 1, 2) y (1, 2, 3). Esta es el inverso del ejercicio pre- 
vio, aunque en realidad ambos problemas son el mismo. 


A. menudo, el teorema fundamental se plantea en forma de la alternativa de Fredholm: 
Para A y b cualesquiera, uno y sólo uno de los siguientes sistemas tiene una solución: 


1) Ax =0b. 
ii) ATy=0, yb 40. 


Ya sea que b esté en el espacio columna C(4) o que en N(A?) exista una y tal que 
yb 4 0. Demuestre que esto es contradictorio, ya que ambos i) y ij) tienen soluciones. 


Encuentre una base para el complemento ortogonal del espacio renglón de A: 
IN e: BN E 
as : 1 A 


Separe x = (3, 3, 3) en una componente del espacio renglón x, y una componente del 
espacio nulo x,,. 


Ilustre la acción de A* mediante una figura que corresponda a la figura 3.4, mandan- 
do C(4) de vuelta al espacio renglón y el espacio nulo izquierdo a cero. 


Demuestre que x — y es ortogonal a x + y si y sólo si [|xl| = [| yl. 


Encuentre una matriz cuyo espacio renglón contenga a (1, 2, 1) y cuyo espacio nulo a 
(1, —2, 1), o demuestre que no puede existir una matriz así. 


Encuentre todos los vectores que son perpendiculares a (1, 4, 4, 1) y (, 9, 8, 2). 


Si Y es el complemento ortogonal de W en R”, ¿existe una matriz con espacio ren- 
glón V y espacio nulo W? Empiece con una base de V, y obtenga tal matriz, 


Si S = (0) es el subespacio de R* que sólo contiene al vector cero, ¿cuál es S*+? Si S 
es generado por (0, O, O, 1), ¿cuál es S+? ¿Cuál es (S+)+? 


¿Por qué son falsas las siguientes afirmaciones? 
a) Si Y es ortogonal a W, entonces V” es ortogonal a W”. 
by Y es ortogonal a W y W ortogonal a Z hace que V sea ortogonal a Z. 


Sea S un subespacio de R”. Explique el significado de (S*)? = S, y por qué es ver- 
dadera. 


Sea P el plano en R? con ecuación x + 2y — z = O. Encuentre un vector perpendicu- 
lar a P. ¿Qué matriz tiene al plano P como espacio nulo y qué matriz tiene a P como 
su espacio renglón? 


Sea S el plano de R* que contiene a todos los vectores con x, + x2 + X3 + x4 = 0. En- 
cuentre una base para el espacio S* que contenga a todos los vectores ortogonales a 5. 


A A A A A A A A 
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23. 


24. 


ZO: 


26. 


27 


> 


28 


> 


29, 


30. 


31. 


32 


33, 


Construya una matriz no simétrica de 2 por 2 con rango 1. Copie la figura 3.4 y escri- 
ba un vector en cada subespacio. ¿Qué vectores son ortogonales? 


Vuelva a dibujar la figura 3.4 para una matriz de 3 por 2 con rango r = 2. ¿Cuál subes- 


pacio es Z (sólo el vector cero)? La parte del espacio nulo de cualquier vector x en R? 
ES X, = 





Construya una matriz con la propiedad requerida o escriba una razón que explique por 
qué es imposible hacerlo. 


1 2 1 
a) El espacio columna contiene . 2 y E | el espacio columna contiene a x | 


1 2 1 
b) El espacio renglón contiene a 3 y S | el espacio nulo contiene a] : | 
1 1 0 
CO) Ax = Al tiene una solución y A* A == Al 
1 0 0 
d) Cada renglón es ortogonal a cada columna (A no es la matriz cero). 
e) La suma de las columnas es una columna de Os y la suma de los renglones es un 
renglón de 1s. 


SI AB = 0, entonces las columnas de B están en las (los) 
A están en las (los) 
rango 2? 





de A. Los renglones de 
de B. ¿Por qué A y B no pueden ser matrices de 3 por 3 con 





a) Si Ax = b tiene una solución y A*y = O, entonces y es perpendiculara ___. 
b) Si A*y = c tiene una solución y Ax = O, entonces x es perpendiculara ____. 
El siguiente es un sistema de ecuaciones Ax = b sin solución: 
x+2y+2.=5 

2x +2y+32=5 

3x +4y+5z2=09, 
Encuentre números y1, Y2 y y3 que multipliquen las ecuaciones de modo que sumen 
O = 1, ¿Encontró un vector y, en cuál subespacio? El producto interno y*b es 1. 


En la figura 3.4, ¿cómo se sabe que Ax, es igual a Ax? ¿Cómo se sabe que este vector 
está en el espacio columna? Si A = É l E > Lal. ¿cuál es x,? 

Si Ax está en el espacio nulo de A*, entonces Ax = O. Razón: Ax también está en el 

de A y los espacios son . Conclusión: ATA tiene el mismo espacio nulo que A. 





Suponga que Á es una matriz simétrica (4* = A). 

a) ¿Por qué su espacio columna es perpendicular a su espacio nulo? 

by) Si Ax = 0 y Az = Sz, ¿cuáles subespacios contienen a los “vectores característicos” 
x y z? Las matrices simétricas tienen vectores característicos perpendiculares 
(consulte la sección 5.5). 


(Recomendado) Dibuje la figura 3.4 con la finalidad de mostrar cada subespacio para 
E Y E da UE O, 
bs 7 2-bd 


Encuentre las piezas x, y Xy, y trace idóneamente la figura 3.4, si 


1-4 > 
A=J/0 0 y x= 3. 
0 0 


Paro 
pe po! 
A! 
Pe 


| 
E 
| 
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Los problemas 34 a 44 son sobre subespacios ortogonales. 


34, 


35. 


36. 


dde 


38. 


39, 


40. 


41. 


42. 


43. 


44, 


Lo 
45. 


Y 


46. 


47. 


Escriba bases de los espacios ortogonales V y W en las columnas de las matrices V y 


W. ¿Por qué VW = matriz cero? Esto corresponde a vw = 0 para vectores, 


El piso y la pared no son subespacios ortogonales porque comparten un vector dife- 
rente de cero (a lo largo de la recta en que se unen). ¡Dos planos en R? no pueden ser 
ortogonales! Encuentre un vector en ambos espacios columna C(A4) y C(B): 


1.2 5 4 
A=|1 3 y B=l6 3|. 
PE 5 1 


Este es un vector Ax y también pz. Piense en la matriz [4 B] de 3 por 4. 


Extienda el problema 353 a un subespacio p-dimensional V y un subespacio q-dimen- 
sional VW de R”. ¿Qué desigualdad sobre p + q garantiza que V se corta con W en un 
vector diferente de cero? Estos subespacios no pueden ser ortogonales. 


Demuestre que cada y en N(A?) es perpendicular a cada Ax en el espacio columna, 
usando la abreviatura para matrices de la ecuación (8). Empiece con A*y = 0, 


¿Sí S es el subespacio de R? que sólo contiene al vector cero, ¿cuál es S+? Si S es ge- 
nerado por (1, 1, 1), ¿cuál es S+? Si S es generado por (2, O, 0) y (0, O, 3), ¿cuál es S*-? 


Suponga que $ sólo contiene a (1, 5, 1) y a (2, 2, 2) (no es un subespacio). Entonces 
S+ es el espacio nulo de la matriz A = . S+ es un subespacio aun cuando S no lo 
sea. 


Suponga que L es un subespacio unidimensional (una recta) en R*. Su complemento 








ortogonal L+ es el (la)____ perpendicular a L. Luego, (L+)*+ es un (una) per- 
pendicular a L+, De hecho, (L,+)* es lo mismo que E 
Suponga que V es todo el espacio R*. Entonces V- sólo contiene al vector Así, 


. De modo que (V+)* es lo mismo que 


(v5* es 
Suponga que $ es generado por los vectores (1, 2, 2, 3) y (1, 3, 3, 2). Encuentre dos 
vectores que generen a S*. Esto es lo mismo que resolver Ax = O ¿para cuál A? 








Si P es el plano de los vectores en R* que satisfacen x, + xy + x3 + X4 = 0, escriba 
una base de P+, Escriba una matriz cuyo espacio nulo sea P. 


Si un subespacio S está contenido en un subespacio V, demuestre que S+ contiene a V+. 


problemas 45 a 50 son sobre columnas y renglones perpendiculares. 


Suponga que una matriz de n por n es invertible: AA”? = 7. Entonces, la primera co- 
lumna de A”? es ortogonal al espacio generado por ¿cuáles renglones de A? 


Encuentre A*A si las columnas de A son vectores unitarios, todos mutuamente perpen- 


diculares. 


Construya una matriz A de 3 por 3 sin elementos cero cuyas columnas sean mutua- 
mente perpendiculares. Calcule 414. ¿Por qué es una matriz diagonal? 


Las rectas 3x + y = b, y 6x + 2y = b, son . Son la misma recta si . En ese 
caso, (b,, b,7) es perpendicular al vector . El espacio nulo de la matriz es la recta 
3x + y = . Un vector particular en ese espacio nulo es 
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49. ¿Por qué es falsa cada una de las siguientes afirmaciones? 
a) (1, 1, 1) es perpendicular a (1, 1, —2), de modo que los planos x + y +z=0y 
x + y — 22 = O son subespacios ortogonales. 
b) El subespacio generado por (1, 1, 0, O, 0) y (0, O, O, 1, 1) es el complemento orto- 
gonal del subespacio generado por (1, —1, 0, 0, 0) y (2, —2, 3, 4, —4). 
c) Dos subespacios que sólo se cortan en cero son ortogonales. 


50. Encuentre una matriz con v = (1, 2, 3) en el espacio renglón y en el espacio colum- 
na. Encuentre otra matriz con v en el espacio nulo y en el espacio colurana. ¿En cuá- 
les pares de subespacios puede no estar v? 


51. Suponga que A es de 3 por 4, que B es de 4 por 5, y que AB = O. Demuestre que ran- 
go(A) + rango(B) <= 4. 


52. El comando N = null(A) produce una base del espacio nulo de A. Así, el comando 
8 = null(N') produce una base para el de A. 








3.2 COSENOS Y PROYECCIONES SOBRE RECTAS 


Los vectores con x*y = O son ortogonales. Ahora se quiere permitir productos internos dis- 
tintos de cero, y ángulos que no sean rectos. Se desea relacionar los productos internos con 
los ángulos, y también con las traspuestas. En el capítulo 1 la traspuesta se construyó dán- 
dole la vuelta a una matriz como si fuese algún tipo de panqué. Es necesario mejorar lo an- 
terior. 

Algo es inevitable: el caso ortogonal es el más importante. Suponga que se desea en- 
contrar la distancia de un punto b a la recta en dirección del vector a. En esa recta se bus- 
ca el punto p más próximo a b. La clave está en la geometría: la recta que une b con p (la 
recta discontinua en la figura 3.5) es perpendicular a a. Este hecho permite encontrar 
la proyección p. Aun cuando a y b no sean ortogonales, el problema de la distancia auto- 
máticamente supone ortogonalidad. 







proyección de b sobre 
P= la recta que pasa por a 


Figura 3.5 La proyección p es el punto (sobre la recta que pasa por a) más próximo a b. 


La situación es la misma que cuando se tiene un plano (o con cualquier subespacio S) 
en vez de una recta. De nuevo, el problema es encontrar el punto p en ese subespacio que 
sea el más próximo a b. Este punto p es la proyección de b sobre el subespacio. Una rec- 
ta perpendicular de b a $ corta al subespacio en p. Geométricamente, así se obtiene la dis- 
tancia entre puntos b y subespacios $. Sin embargo, hay dos preguntas que es necesario 
plantear: 








S 


3.2 Cosenos y proyecciones sobre rectas 153 


1. Esta proyección, ¿realmente se presenta en aplicaciones prácticas? 
2. Sise tiene una base del subespacio $, ¿hay una fórmula para la proyección p? 


Ciertamente, las respuestas son sí. Este es exactamente el problema de la solución por 
mínimos cuadrados de un sistema sobredeterminado. El vector b representa los datos pro- 
venientes de experimentos o cuestionarios, y contiene demasiados errores para ser encon- 
trado en el subespacio S. Cuando se intenta escribir b como una combinación de los 
vectores de la base de $, no es posible hacerlo, ya que las ecuaciones son inconsistentes, y 
Ax = b no tiene solución. 

El método de mínimos cuadrados selecciona a p como la mejor opción para sustituir 
a b. No puede haber duda sobre la importancia de esta aplicación. En economía y estadís- 
tica, los mínimos cuadrados introducen el análisis de regresión. En geodesia, el departa- 
mento de agrimensura de Estados Unidos abordó 2.5 millones de ecuaciones en 400 000 
incógnitas. 

Una fórmula para p es fácil cuando el subespacio es una recta. Entonces b se proyec- 
tará sobre a de varias formas, y la proyección p se relacionará con varios productos inter- 
nos y ángulos. La proyección sobre un subespacio de dimensión mayor es por mucho el 
caso más importante; corresponde a un problema de mínimos cuadrados con varios pará- 
metros, y se resolverá en la sección 3.3. Las fórmulas son incluso más sencillas cuando se 
produce una base ortogonal de $. 


Productos internos y cosenos 


A continuación se abordará el análisis de los productos internos y los ángulos. Pronto se 
verá que no es el ángulo, sino el coseno del ángulo, el que está relacionado directamente 
con los productos internos. Se acude a la trigonometría en el caso bidimensional para en- 
contrar la relación. Suponga que los vectores a y b forman ángulos «: y [£ con el eje x (véa- 
se la figura 3.6). 





Figura 3.6 Coseno del ángulo 9 = [£ — a: usando productos internos. 


La longitud |lal] es la bipotenusa del triángulo OaQ. Así, el seno y el coseno de a son 


da a; 
sena =—, cosa = —. 
la! hall 
Para el ángulo £, el seno es b>/[| bl, y el coseno es bh, /|bl|. El coseno de 9 = £ — a provie- 
ne de una identidad inolvidable: 


ab; oa arb, 
Fórmula del coseno  cosó =cos [cosa +sen 6 sena = A anian 1d) 
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El numerador en esta fórmula es exactamente el producto interno de a y b. Esto es propor- 
cional a la relación entre a*b y cos 6: 


HA 


a e A A NOTES 

á o E A O OS 7 
PE A pl. A PA 
Am 1 A, 1. Ps ye * 
bo G El coseno del 
E . Y 

pd, AA p 

sy : ú » 8 . z qn, 

a . E x A 
A RS A Y A 
E E AS A SS A . 


O O 
AN 


ángulo entre dos vectores a y b cualesquiera diferentes de cero es 


a*b 


a ! E ! len 


O! 
E 
zs 









Esta fórmula es dimensionalmente correcta: si se duplica la longitud de b, entonces tanto 
el numerador como el denominador se duplican, y el coseno permanece sin cambio. Al in- 
vertir el signo de b, por otra parte, se invierte el signo de cos 0 y el ángulo cambia por 180”. 

Hay otra ley de trigonometría que conduce directamente al mismo resultado. No es tan 
inolvidable como la fórmula de la ecuación (1), aunque relaciona las longitudes de los la- 
dos de cualquier triángulo: 


Ley de los cosenos [5 — al? = [|511? + lla]? — 2116] llal| cos. (3) 


Cuando 9 es un ángulo recto, se acude al teorema de Pitágoras: Ilb — all? = [151% + llal|?. 
Para cualquier ángulo 6, la expresión |¡b —- aj? es (b — ayT(b — a), y la ecuación (3) se con- 
vierte en 

bb—2a Tb +ata =b"b + aa — 2]16]] |a]| cos 6. 


Al cancelar b*b y a*a en ambos miembros de esta ecuación, se reconoce la fórmula (2) pa- 
ra el coseno: a“b = Jlall 1161] cos 6. De hecho, esto demuestra la fórmula del coseno en n 
dimensiones, ya que sólo es necesario preocuparse sobre el triángulo plano Oab. 


Proyección sobre una recta 


Ahora se desea encontrar el punto proyección p. Este punto debe ser algún múltiplo 
p = Xa del vector dado a: cada punto sobre la recta es un múltiplo de a. El problema es 
calcular el coeficiente Y. Todo lo que se requiere es el hecho geométrico de que la recta 
desde b al punto más próximo p == Xa es perpendicular al vector a: 


(b—X%a) La, obien a(b—Xa) =0, o bien X = cd (4) 


Así se obtiene la fórmula para el número X y la proyección p: 


A, 


mt TER > SA 
EN gi e 


ón del vector b sobre la recta en la dirección de a es p : | 


ns 












AS 


*+3H La proyecci 






¿ ERA RS > e atb: * 
Proyección sobre una recta Ep= xa =-—_aN 
EA ES a A E * a a 


Esto permite volver a trazar la figura 3.5 con una fórmula correcta para p (véase la figura 3.7). 

Lo anterior conduce a la desigualdad de Schwarz en la ecuación (6), que es la desi- 
gualdad más importante en matemáticas. Un caso especial es el hecho de que las medias 
aritméticas ; (x + y) son más grandes que las medias geométricas ,/Xy. (Esto es equiva- 
lente —consulte el problema 1 al final de esta sección— a la desigualdad del triángulo para 
vectores.) Parece que la desigualdad de Schwarz surge casi accidentalmente de la afirmación 
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3.2 Cosenos y proyecciones sobre rectas 155 





* .e ” Op a*b 
Figura 3.7 Proyección p de b sobre a, con YAQ= — mm AAA, 
g , P es Ob Mal ibn 


de que ||e]]? = [14 — p]1? en la figura 3.7 no puede ser negativa: 


a"b 2 (Thy (E) a (WbraTa) e (aTby? un 


b=—al =bb-2_— 
ñ ata aYa (aTa) Es 


atra 














Lo anterior indica que are a > do , y luego se toman las raíces cuadradas: 


MIA 





 5b lap 1151. 


Según la fórmula (2), la razón entre a*b y |lal| b]| es exactamente |cos 6|. Debido a que 
todos los cosenos están en el intervalo -1 < cos 6 <= 1, esto constituye otra demostración 
de la ecuación (6): la desigualdad de Schwarz es lo mismo que [cos 0] <= 1. De alguna ma- 
nera es una demostración que se entiende más fácilmente debido a que los cosenos son bas- 


tante conocidos. Cualquier demostración está bien en R”, aunque debe observar que la aquí 


proporcionada provino directamente del cálculo de [Ib — plI?. Esto permanece no negativo 
cuando se introducen nuevas posibilidades para las longitudes y los productos internos. El 
nombre de Cauchy también está ligado a esta desigualdad Ja*b| <= |la]| [Ibll, ¡y los rusos se 
refieren a ella como la desigualdad de Cauchy-Schwarz-Buniakowsky! Los historiadores 
expertos en matemáticas parecen coincidir en que la reclamación de Buniakowsky es legí- 
tima. 

Una observación final sobre ja*b]| <= llal| ¡bl|. La igualdad se cumple si y sólo si b es 
un múltiplo de a. El ángulo es 9 = 0 o 6 = 1807 y el coseno es 1 o —1. En este caso hb es 
idéntico a su proyección p, y la distancia entre b y la recta es cero. 


Proyectar b = (1, 2, 3) sobre la recta que pasa por a = ( 1, 1, 1) para obtener X y p: 


ab 6 
X= ==, 
jj aTa 3 
La proyección es p = xa = (2,2, 2). El ángulo entre a y b tiene 
AN lata también cosó = ae sn a 
mi ym ? la Wol — /3/14 


La desigualdad de Schwarz ja"b] < llal| !Ibl| es 6 < 43414. Si 6 se escribe como /36, 
esto es lo mismo que V436 < /42. El coseno es menor que 1, ya que b no es paralelo a a. 
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Ejemplo 2 


Matriz proyección de rango 1 


La proyección de b sobre la recta que pasa por a está en p = a(aTb/a*a). Esta es nuestra 
fórmula p = Xa, aunque aquí se ha escrito con un leve giro: El vector a aparece antes que 
el número £ = aTh/aTa. Detrás de este cambio aparentemente trivial hay una razón. La 
proyección sobre una recta es llevada a cabo por una matriz proyección P, y escrita en es- 
te nuevo orden puede verse de qué se trata. P es la matriz que multiplica a b y produce p: 


Es 


P =a-=- de modo que la matriz proyección es '. P. 


(7) 





Esto es una columna multiplicada por un renglón —una matriz cuadrada— dividida entre 
el número a%a. 


La matriz que proyecta sobre la recta que pasa por a = (1, 1, 1) es 


1 O 
| 3 03-13 
P= —=-=]] [1 1 1] = E 
E 3 3 3 

a*a 3 1 1 y L 

31 3703 


Esta matriz tiene dos propiedades que serán consideradas como típicas de las proyecciones: 


1. Pesuna matriz simétrica. 
2. Su cuadrado es ella misma: P? = P, 


P?b es la proyección de Pb, ¡y Pb ya está en la recta! Así, P?b = Pb. Esta matriz P tam- 
bién constituye un gran ejemplo de los cuatro subespacios fundamentales: 


El espacio columna consta de la recta que pasa por a = (1, 1, 1). 
El espacio nulo consta del plano perpendicular a a. 
El rango es r = 1. 


Toda columna es un múltiplo de a, así como también lo es Pb = Xa. Los vectores que pro- 
yectan hacia p = 0 son especialmente importantes. Satisfacen a*b = O son perpendicula- 


res a a y su componente a lo largo de la recta es cero. Están en el espacio nulo = plano 
perpendicular. 


En realidad, este ejemplo es demasiado perfecto. Tiene el espacio nulo ortogonal al es- 
pacio columna, que se ha vuelto loco. El espacio nulo debe ser ortogonal al espacio ren- 
glón. Pero como P es simétrica, sus espacios renglón y columna son el mismo. 


Observación sobre la escalación La matriz proyección aa*/a'a es igual a a si se duplica: 


e 

2 Z 3) 3 3 

ES mn 0 O 
a = |(2| proporciona P = 17 21[2 2 2)=|% 3 1] como antes. 

2 2 E: 

2 a 


La recta que pasa por a es la misma, y eso es todo lo que le importa a la matriz proyección. 
Si la longitud de a es 1, el denominador es a*a = 1 y la matriz es justo P = aa!. 
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Ejemplo 3 
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Proyectar sobre la “dirección 0” en el plano x-y. La recta pasa por a = (cos 0, sen 0) y la 
matriz es simétrica con P? = P: 


A a 


Aquí, c es cos Ó, ses sen O y c? + s? = 1 en el denominador. Esta matriz P se descubrió en 
la sección 2.6 sobre transformaciones lineales. Ahora, P se conoce en cualquier número de 
dimensiones. Se recalca que produce la proyección p: 





Traspuestas de productos internos 


Por último, los productos internos se relacionan con A”. Hasta el momento, A* es simple- 
mente la reflexión de A a través de la diagonal principal: los renglones de A se convierten 
en las columnas de A*, y viceversa. El elemento en el renglón i, columna ¡ de A es el ele- 
mento (7, ¿) de A: 

Traspuesta por reflexión (47), =(4) y. 


Hay un significado más profundo de A*. Su estrecha relación con los productos internos 
E ria una nueva ed mucho más “abstracta” definición de la petaca 


DET La trasplesta. Saz puede: eólico AS st siguiente "propiedad: dl producto 
interno de Ax con y es igual al a interno de? x Con AY ' Formalmente, esta sig- 19 
nifica simplemente, que. a, A o + 





Esta definición constituye otra (mejor) manera de comprobar la fórmula (AB)* = BYAT, La 
ecuación (8) se aplica dos veces: 
Primero se mueve A y luego se mueve B_ (ABx) y =(BI (A y) =x (BTA? y). 


La traspuesta se da vuelta en orden inverso sobre el lado derecho, justo como hacen las 
inversas en la fórmula (AB)7! = B7147 1, Se hace mención nuevamente que estas dos 
fórmulas se encuentran para producir la extraordinaria combinación (47) = (AB7!, 





Conjunto de problemas 3.2 


1. a) Dados dos números positivos cualesquiera x y y, escoja el vector b igual a (Vx, /Y)» 
y escoja a =(./y, /x). Aplique la desigualdad de Schwarz para comparar la media 
aritmética 1 (x + y) con la media geométrica ,/xy. 

b) Suponga que se empieza con un vector que va del origen al punto x, y que luego se 
suma un vector de longitud |y] que une x con x + y. El tercer lado del triángulo va 
del origen ax + y. La desigualdad del triángulo establece que esta distancia no 
puede ser mayor que la suma de las dos primeras distancias: 


158 


Capítulo 3 Ortogonalidad 


A 


10. 
11. 


12. 
13, 


Ix + yl < lx + Dll 


Después de elevar al cuadrado ambos miembros, y desarrollar (x + YN + y), reduz- 
ca lo anterior a la desigualdad de Schwarz. 


Compruebe que la longitud de la proyección en la figura 3.7 es lIlpll = |[bl] cos0, 
aplicando la fórmula (5). 


¿Qué múltiplo de a = (1, 1, 1) está más próximo al punto b = (2, 4, 4)? También en- 
cuentre el punto más próximo a a sobre la recta que pasa por b. 


Explique por qué la desigualdad de Schwarz se vuelve igualdad cuando a y b están so- 
bre la misma recta que pasa por el origen, y sólo en ese caso. ¿Qué ocurre si están en 
lados opuestos del origen? 


En n dimensiones, ¿qué ángulo forma el vector (1, 1, ... , 1) con los ejes de coorde- 
nadas? ¿Cuál es la matriz proyección P sobre ese vector? 


La desigualdad de Schwarz puede demostrarse en una línea si a y b se normalizan de- 
lante del tiempo para que sean vectores unitarios: 


laTbi = aj, | < Y lab < Ei A E - +3= lla 1101. 


¿Cuál de los problemas previos justifica el paso de en medio? 


Escoja el vector correcto b en la desigualdad de Schwarz para demostrar que 
(ay +=" +ayY <n(aj ++ +a?). 


¿Cuándo se cumple la igualdad? 


La molécula de metano CH, está dispuesta como si el átomo de carbono estuviese en 
el centro de un tetraedro regular con cuatro átomos de hidrógeno en los vértices. Si los 
vértices están en (0, O, 0), (1, 1, 0), (1, O, 1), y (0, 1, 1) —observe que la longitud de 
todas las seis aristas es /2, de modo que el tetraedro es regular—, ¿cuál es el coseno 
del ángulo formado por los rayos que van del centro (3, 3, 5) a los vértices? (El ángu- 
lo de enlace en sí mide aproximadamente 109.5%, un viejo conocido de los químicos.) 


Eleve al cuadrado la matriz P = aa*/a*a, que proyecta sobre una recta, y demuestre 
que P? = P. (¡Observe el número a*a en medio de la matriz aaTaa*!) 


La matriz proyección P, ¿es invertible? ¿Por qué? 


a) Encuentre la matriz proyección P, sobre la recta que pasa por a = E y también 
la matriz P, que proyecta sobre la recta perpendicular a a. 


b) Calcule P, + P,, P,P,, y explique. 
Encuentre la matriz que proyecta todo punto en el plano sobre la recta x + 2y = 0. 


Demuestre que la traza de P = aa*/a*a —que es la suma de sus elementos diagona- 
les— siempre es igual a 1. 





t 
| 
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14. ¿Cuál matriz P proyecta todo punto de R? sobre la recta de intersección de los planos 
x+ty+t=0yx-—t=0? 


15. Demuestre que la longitud de Ax es igual a la longitud de ATx si AAY = ATA. 
16. Suponga que P es la matriz proyección sobre la recta que pasa por a. 
a) ¿Por qué el producto interno de x con Py es igual al producto interno de Px con y? 


b) ¿Son iguales los dos ángulos? Encuentre sus cosenos si a = (1, 1, —1), x = (2, 0, 
D, y y = Q, 1,2). 


c) ¿Por qué el producto interno de Px con Py siempre es el mismo? ¿Cuál es el ángu- 
lo entre Px y Py? 


En los problemas 17 a 26 se piden proyecciones sobre rectas. También los errores 
e = b-—p, y las matrices P. 


17. Proyecte el vector b sobre la recta que pasa por a. Compruebe que e es perpendicular 


aa: 
1 1 1 —] 
a b=|2 y a=yj1!l b b=)]3 a 

z 1 1 =] 


18. Trace la proyección de b sobre a y también calcúlela a partir de p = Ya: 
__¡cosó ol NS O O: 
lr reo E 


19. En el problema 17, encuentre la matriz proyección P = aa*/a*a sobre la recta que pa- 
sa por cada vector a. En ambos casos, compruebe que P? = P. Multiplique Pb en ca- 
da caso para calcular la proyección p. 


20. Construya las matrices proyección P, y P, sobre las rectas que pasan por cada vector 
a del problema 18. ¿Es cierto que (P, + P,)? = P, + P,? Esto sería cierto si P,P, = 
O. 


Para los problemas 21 a 26, consulte las figuras que se muestran a continuación. 


> P201 á , 
SS => a= o] 
—1 P,P241 


Problemas 21 a 23 Problemas 24 a 26 


a 


21. Construya las matrices proyección aa*/a*a sobre las rectas que pasan por a, = (—1, 
2, 2) y a, = (2, 2, — 1). Multiplique estas matrices proyección, y explique por qué su 
producto P|P, es lo que es. 
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22. Proyecte b = (1, 0, 0) sobre las rectas que pasan por a, y a, del problema 21 y tam- 
bién sobre az = (2, — 1, 2). Sume las tres proyecciones p, + pa + P3. 


23. Continuando con los problemas 21 y 22, encuentre la matriz proyección Py sobre az = 
(Q, —1, 2). Compruebe que P, + P, + Pa = [. ¡La base a,, a,, az es ortogonal! 


24. Proyecte el vector b = (1, 1) sobre las rectas que pasan por a, = (1, 0) y a, = (1, 2). 


Trace las proyecciones p, y p, y sume p;, + p>. La suma de las proyecciones no es b 
porque las as no son ortogonales. 


25. En el problema 24, la proyección de b sobre el plano de a, y a, es igual a b. Encuentre 
P =A(ATA)J"4” para A = la, az] = E al 





26. Proyecte a, = (1, 0) sobre a, = (1, 2). Luego proyecte el resultado de vuelta sobre a;. 


Trace estas proyecciones y multiplique las matrices proyección P,P»: ¿Ésta es una 
proyección? 


4 3.3 PROYECCIONES Y MÍNIMOS CUADRADOS 

Hasta el momento, Ax = b tiene una solución o no. Si b no está en el espacio columna C(A), 
entonces el sistema es inconsistente y la eliminación gaussiana fracasa. Casi seguramente, 
esta falla ocurre cuando hay muchas ecuaciones y sólo una incógnita: 


¿ 
E 
, 


Más ecuaciones 2x =b; 
que incógnitas: 3x = ba 
¿no hay solución? 4x = ba. 


Este sistema es resoluble cuando la razón entre b,, ba y bz es 2:3:4. La solución x existe só- 
lo sí b está sobre la misma recta que la columna a = (2, 3, 4). 

A pesar de su irresolubilidad, las ecuaciones inconsistentes se presentan todo el tiem- 
po en la práctica. ¡Es necesario resolverlas! Una posibilidad es determinar x con base en 
una parte de ese sistema e ignorar el resto; esto es difícil de justificar si todas las m ecua- 
ciones vienen de la misma fuente. En vez de esperar que en algunas ecuaciones no haya 
error y que en otras el error sea grande, es mucho mejor escoger la x que minimiza un error 
promedio E en las m ecuaciones. 

El “promedio” más conveniente proviene de la suma de los cuadrados: 


A 


Error al cuadrado E? = (2x — b,Y + (3x — ba? + (4x — b3Y. 


Si hay una solución exacta, el error mínimo es E = O. En el caso más probable en que hb no | 


sea proporcional a a, la gráfica de E? es una parábola. El error mínimo está en el punto más : 
bajo, donde la derivada es cero: 


dE* | 
RR 21(2x — b132 + (3x — b2)3 + (4x — b3)J4] =0. i 
Al despejar x, la solución por mínimos cuadrados de este sistema modelo ax = b se deno- 


ta por Xx: 
2 _2b1+3b,+4b3 _ a b 
EC TAFRERA ala ) 
En el numerador se reconoce a*b, y en el denominador, aTa. | 
El caso general es el mismo. ax = b se “resuelve” al minimizar 


Solución por mínimos cuadrados 


E? = ax —bló =(ax by? ++ +(64x — Bn). 
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pe Ea CU UZ21 URUGUAY 
1 ento: de E? es cerd en'el puatd ER: sp 


(ax Sd bpQa; e BS (Amp X ha Dd =(, 


Se está minimizando la distancia de b a la recta que pasa por a, y en cálculo se obtiene 
la misma respuesta, X = (a,b, + +++ +ambrlWa? +- ++ +a? ), que se obtuvo antes con 
la geometría: 





mana LE 1 y 


Puede darse cuenta de que seguimos regresando a la interpretación geométrica de un 
problema de mínimos cuadrados: minimizar una distancia. Al igualar a cero la derivada de 
E?, el cálculo confirma la geometría de la sección previa. El vector error e que une b con 
p debe ser perpendicular a a: 


T 
Ortogonalidad deaye a(b-—Za) = a b-— ta = 0. 
ata 


Como observación al margen, observe el caso degenerado a = 0, Todos los múltiplos 
de a son cero, y la recta es sólo un punto. En consecuencia, p = O es el único candidato pa- 
ra la proyección. Sin embargo, la fórmula para Y se convierte en una expresión 0/0 sin sen- 
tido, y correctamente refleja el hecho de que Y está completamente indeterminado. Todos 
los valores de x proporcionan el mismo error E = [Ox — bl), de modo que E? es una recta 
horizontal en vez de una parábola. La “seudoinversa” asigna el valor definitivo Xx = O, que 
es una elección más “simétrica” que cualquier otra. 


Problemas de mínimos cuadrados con varias variables 


Ahora ya estamos listos para dar un paso importante: proyectar b sobre un subespacio —en 
vez de hacerlo simplemente sobre una recta. Este problema se presenta de Ax = b cuando 
A es una matriz de m por n. En vez de una columna y una incógnita x, ahora la matriz tie- 
ne 1 columnas. El número m de observaciones sigue siendo mayor que el número n de in- 
cógnitas, por lo que es de esperar que Ax = bh sea inconsistente. Quizá no haya una elección 
de x que se ajuste perfectamente a los datos b. En otras palabras, probablemente el vector 
b no sea una combinación de las columnas de A; está fuera del espacio columna. 

De nuevo el problema es escoger x con la finalidad de minimizar el error, y de nuevo 
esta minimización se hace en el sentido de mínimos cuadrados. El error es E = |4x — bl), y 
es exactamente la distancia de b al punto Ax en el espacio columna. Buscar la solución 
por mínimos cuadrados X, que minimiza £, es lo mismo que ubicar el punto p = AX que 
está más próximo a b que cualquier otro punto en el espacio columna 

Para determinar X puede usarse geometría o cálculo. En n dimensiones es preferible 
utilizar geometría; p debe ser la “proyección de b sobre el espacio columna”. El vector 
error e = b— Ax debe ser perpendicular a ese espacio (véase la figura 3.8). Encontrar 
X y la proyección p = AX es tan fundamental que se hace de dos maneras: 


1. * Todos los vectores perpendiculares al espacio columna están en el espacio nulo iz- 
quierdo. Así, el vector error e = hb — AX debe estar en a po nulo de A?*: 


ANb—AX)=0 obien CATAZ — AT. 





E 
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b 
q E 
le columna a; aje=0 
LA 
aje=0 
Sd po se combinan en 


ATe = AY(b— AT)=0 
columna as 





Figura 3.8 Proyección sobre el espacio columna de una matriz de 3 por 2. 


2. El vector error debe ser perpendicular a cada columna a,,... , a, de A: 
ai(b = AX)=0 al 

. o bien : pa Os 
ar(b— AX) =0 al 


hn 


Esto es nuevamente AT(b— AX) =0 y ATAX = ATb. El método del cálculo consis- 
te en tomar derivadas parciales de E? = (Ax — bD'Y(Ax — b). Así se obtiene lo mismo 
que 2AT Ax — 24Tb = 0. La forma más rápida es multiplicar la ecuación irresoluble Ax 
= b por A*. Con todos estos métodos equivalentes se obtiene una matriz de coeficientes 
cuadrada ATA. Es simétrica (¡su traspuesta no es A4*!) y es la matriz fundamental de este 
capítulo. 


En estadística, las ecuaciones ATAX = ATb se conocen como ecuaciones normales. 
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Se escoge un ejemplo en donde nuestra intuición es tan buena como las fórmulas: 


1 2 5 Ax =b no tiene solución 
A=|1 3|, b=1S|, E | 
0 0 6 ATAXZ = ATb proporciona la mejor x. i 


uk 


Ambas columnas terminan con un cero, de modo que C(4) es el plano x-y dentro del espa- | 
cio tridimensional. La proyección de b = (4, 5, 6) es p = (4, 5, 0); las componentes x y y 
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permanecen igual pero z = Ó desaparece. Este hecho lo confirman las ecuaciones normales: 


O e 
di 23 ol 


13 -s fi 1 o _f2 
5 2|1|2 30 El 


EZ 2 4 
Proyección p= AX OS: A = Si, 
0 0 


O Y nn 


x= (A CAY) "Ab 
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En este caso especial, lo mejor que puede hacerse es resolver las dos primeras ecuaciones 
de Ax = b. Así, x, =2 y X2 = 1. Es seguro que el error en la ecuación Ox, + Ox, = 6 es 
el 6. 


Observación ] Suponga que b está realmente en el espacio columna de A: es una combi- 
nación b = Ax de las columnas. Entonces, la proyección de b sigue siendo b: 


b en el espacio columna p =ACATAJNTATAx =Axr=b. 
El punto p más próximo es justo b mismo, lo cual es evidente. 


Observación 2 En el otro extremo, suponga que bh es perpendicular a cada columna, de 
modo que A*b = O, En este caso b se proyecta al vector cero: 


b en el espacio nulo izquierdo p = A(ATAY?ATD = ACATAYO =0. 


Observación 3 Cuando A es cuadrada e invertible, el espacio columna es todo el espacio. 
Cada vector se proyecta en sí mismo, p es igual a b, y X = x:. 


SiA esinvertible p = A(ATAJTATb= AATUATYIAFb =b. 


Este es el único caso en que es posible separar (ATA)”*, y escribirla como ATUAB)?, 
Cuando A es rectangular esto no es posible. 


Observación 4 Suponga que A sólo tiene una columna, que contiene a a. Entonces la ma- 
triz ATA es el número ala y x es a b/a "a. Se regresa a la primera fórmula, 


La matriz producto cruz ATA 


La matriz AYA es ciertamente simétrica. Su traspuesta es (ATA)" = ATAF", que es AYA de 
nuevo. Su elemento ¿, j (y el elemento j, ¿) es el producto interno de la columna ¿de A con 
la columna j de A. La cuestión clave es la invertibilidad de A*A, y por fortuna 


ATA tiene el mismo espacio nulo que A. 


Ciertamente, si Ax = 0, entonces A*Ax = 0. Los vectores x en el espacio nulo de A también 
están en el espacio nulo de ATA. Para ir en la otra dirección, debe empezarse suponiendo 


AIDA o e ri an re 
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que ATAx = 0, y tomar el producto interno con x para demostrar que Ax = 0: 
x*ATAx =0, obien, [Ax]? = 0, o bien, Ax =0. 


Los dos espacios nulos son idénticos. En particular, si las columnas de A son independien- 
tes bs a x= sel está en su e dad dc entonces lo mismo es cierto para ATA: 






 vermble. e sa A 


Después se demostrará que ATA también es positiva definida (todos los pivotes y los valo- 
res característicos son positivos). 

Este caso es por mucho el más común e importante. La independencia no es tan difí- 
cil en un espacio m-dimensional si m > n. Esto se supone de aquí en adelante. 


Matrices proyección 


Se ha demostrado que el punto más próximo abes p = A(ATA)”"!A4*b. Esta fórmula ex- 
presa en términos matriciales la construcción de una recta perpendicular de b al espacio 
columna de A. La matriz que proporciona P es una matriz A denotada por P: 


30%! 


Matriz proyección PS LATA) Ar. (4) 





AE 


Esta matriz proyecta cualquier vector b sobre el espacio columna he A.” En otras palabras, 
p = Pb es la componente de b en el espacio columna, y el error e = b-— Pb es la compo- 
nente en el complemento ortogonal. (¡7 — P también es una matriz proyección! Proyecta b 
sobre el complemento ortogonal, y la proyección es b-— Pb.) 

En breve, se tiene una fórmula matricial para separar cualquier b en dos componentes 
perpendiculares. Pb está en el espacio columna C(A), y la otra componente (1 — P)Jb está en 
el espacio nulo izquierdo N(A), que es ortogonal al espacio columna. 

Las matrices proyección pueden entenderse dd y A A 


¿ 
É 
$ 
| 
3 
¿ 





Demostración Es fácil ver por qué P? = P. Si se empieza con cualquier b, entonces Pb 
está en el subespacio sobre el que se está proyectando. Cuando se vuelve a proyectar na- 
da cambia. El vector Pb ya está en el subespacio, y P(Pb) sigue siendo Pb. En otras pala- 


bras, P? = P, Dos o tres o cincuenta proyecciones proporcionan el mismo punto p que la 
primera proyección: 


IT RARA ALIS DC 0 AR OC E ola A 2 ORAR CAR 1 


0 pro 


2= AA TOVAAFOTA <= AATAY AT <P 


ml ll 7 LIS A HOM AAN 097 


"Puede haber un riesgo de confusión con las matrices permutación, que también se denotan por P, aunque el ries- 
go debe ser pequeño, y trataremos que nunca aparezcan ambas en la misma página. | 


Ejemplo 1 
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Para demostrar que P también es simétrica, se toma su traspuesta. Las traspuestas se 
multiplican en orden invertido, y se usa la simetría de (AA), para regresar a P: 


PERALTA) OA AMADA AA TA LAS => P 


Para la conversa, a partir de P? = P y P* = P es necesario deducir que Pb es la pro- 
yección ortogonal de b sobre el espacio columna de P. El vector error b — Pb es ortogo- 
nal al espacio. Para cualquier vector Pc en el espacio, el producto interior es cero: 


(b— PO"Pc =bU1 — PPC =bUP — P?c=0. 
Así, b— Pb es ortogonal al espacio, y Pb es la proyección sobre el espacio columna. — MM 


Suponga que A es verdaderamente invertible. Si es de 4 por 4, entonces sus cuatro colum- 
nas son independientes y su espacio columna es todo R*. ¿Cuál es la proyección sobre to- 
do el espacio? Es la matriz identidad. 


P=A(ATAJTAT= AACUADTIAT <= 1, (5) 
La matriz identidad es simétrica, 7? = [, y el error b — Ib es cero. 


La cuestión con todos los otros ejemplos es que lo que ocurrió en la ecuación (3) no 
se permite. Para repetir: No es posible invertir las partes por separado A* y A cuando estas 
matrices son rectangulares. La que es invertible es la matriz ATA. 


Ajuste de datos por mínimos cuadrados 


Suponga que se realiza una serie de experimentos, y se espera que la salida b sea una fun- 
ción lineal de la entrada t. Se busca una línea recta b = C + Dt. Por ejemplo: 


1. En instantes diferentes se mide la distancia a un satélite en su camino a Marte. En es- 
te caso £ es el tiempo y bes la distancia. A menos que el motor esté encendido o la gra- 
vedad sea intensa, el satélite se moverá casi a velocidad constante v: b = by + vt. 

2. En una estructura se hace variar la carga, y se mide el movimiento que esto produce. 
En este experimento t es la carga y b es la lectura en el medidor de deformación. 
A menos que la carga sea tan grande que el material se vuelva plástico, en la teoría de 
la elasticidad es normal una relación lineal b = C + Dit, 

3. Elcosto de producción de f libros como éste es casi lineal, b = C + Dr, con la edición 
y la composición en C y luego la impresión y la encuadernación en D. Así, € es el cos- 
to de preparación y D es el costo por cada libro adicional. 


¿Cómo calcular C y D? Si no hay error experimental, entonces dos mediciones de b 
determinan la recta b = C + Dt. Pero si hay error, es necesario estar preparado para *pro- 
mediar” los experimentos y encontrar una recta Óptima. ¡Esta recta no debe confundirse 
con la recta que pasa por a sobre la cual se proyectó b en la sección previa! De hecho, ya 
que hay dos incógnitas por determinar: C y D, ahora se proyecta sobre un subespacio bidi- 
mensional. Un experimento perfecto debe proporcionar una C y una D perfectas: 
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C + Dt =b; 
Est DE ba 


(6) 


C- +Din* Dn: 


Este es un sistema sobredeterminado, con m ecuaciones y sólo dos incógnitas. Si hay erro- 
res presentes, el sistema no tiene solución. A tiene dos columnas, y x = (C, D): 


1 tf; b] 

1 2 8 b, 

A | | = | |, oOobien, Ax =b. 09 
: : D : 


La mejor solución (C : D) es la Y que minimiza el error al cuadrado E?: 
Minimizar E? = Ib — Axl? =(b, —- C —- Dty? ++ ++ Hbn —C — Dtn)?. 


El vector p = AX está lo más próximo posible a b. De todas las rectas b = C + Dt, se es- 
tá eligiendo la que mejor se ajusta a los datos (véase la figura 3.9). En la gráfica, los erro- 
res son las distancias verticales b -— C- Dt a la recta (¡no son distancias perpendiculares!) 
Son las distancias verticales las que se elevan al cuadrado, se suman, y minimizan. 
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Figura 3.9 La aproximación por una recta corresponde a la proyección p de b. 


Ejemplo 2  Enla figura 3.94 se muestran tres mediciones b,, b, bx: 


b=1lent=-1, b=1lent=1, b=3Y3 en t= 2. 


Observe que no se requiere que los valores £ = —1, 1, 2 sean equidistantes. El primer pa- 
so es escribir las ecuaciones que se cumplirían si una recta pudiera pasar por todos los 
tres puntos. 
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Entonces C + Dr coincidiría exactamente con b: 


Ca D=1 1 —1 C 1 
Ax=b es C+ D=1l0bienjl 1 HE Ls 
C +2D=3 1 2] 3 


Si estas ecuaciones Áx = b pudieran resolverse, no habría errores. No es posible resolver- 
las porque los puntos no están en una recta. En consecuencia, se resuelven por mínimos 


cuadrados: 
A*Ax =A'b es E Ñ 5 = me 


La mejor solución es € = 2, D = 5, y la mejor recta es - + St, 


Observe las hermosas relaciones entre las dos figuras. El problema es el mismo pero 
el arte lo muestra distinto. En la figura 3.9b, b no es una combinación de las columnas 
(1,1, D) y —1, 1, 2). En la figura 3.9, los tres puntos no están sobre una recta. ¡Los míni- 
mos cuadrados sustituyen los puntos b que no están sobre una recta por puntos p que sí es- 
tán! Al no ser posible resolver Ax = b, se o AX = p. 


La recta 5 + Í£ tiene alturas $, L y 4 en los instantes de medición —1, 1, 2. Estos 


puntos están Sobre una recía. En Una: el vector p = (5,5 > $) está en el espa- 
cio columna. Este vector es la proyección. La figura 3.9b está en es de fciones (o en m 
dimensiones si hay m puntos) y la figura 3.9a está en dos dimensiones (o en n dimensio- 
nes si hay n parámetros). 

Al restar p de b, los errores son e = (3, — £, 2). Estos son los errores verticales en la 
figura 3.9a, y son las componentes del vector a S la figura 3.9b. Este vector 
error es ortogonal a la primera columna (1, 1, 1), ya que 5 2 — - +5 5 = 0, Es ortogonal a la 


segunda columna (—1, 1, 2) porque —3—£-+3 =0, Es O al espacio columna, 


y está en el espacio nulo izquierdo. 
Pregunta: Si las mediciones b = (5, — £, 2) fuesen estos errores, ¿cuál sería la mejor 


recta y el mejor X? Respuesta: La recta cero, que es el eje horizontal, y X = 0. Proyección 
a cero. 

Fácilmente pueden resumirse las ecuaciones para ajustar una recta. La primera colum- 
na de A contiene a los 1s y la segunda columna a los tiempos t,. En consecuencia, AYA con- 
tiene a la suma de los 1s y los £,, así como a dl 





¿eo 6 boy Así, la rec 





Observación Las matemáticas de los mínimos cuadrados no están limitadas a ajustar los 
datos por rectas. En muchos experimentos no hay razón para esperar una relación lineal, y 
no tendría sentido buscar una. Suponga que se manipula material radiactivo. La salida b es 
la lectura de un contador Geiger en varios instantes £. Podría saberse que se está trabajan- 
do con una mezcla de dos productos químicos, de los cuales se conocen sus vidas medias 
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(o tasas de desintegración), aunque se ignora la cantidad que se está manipulando de cada 
producto. Si estas dos cantidades desconocidas son C y D, entonces las lecturas del conta- 
dor Geiger se comportarían como la suma de dos exponenciales (y no como una recta): 


b=Ce * +De"*, (8) 
En la práctica, el contador Geiger no es exacto. En vez de ello, se toman lecturas 
bi,...,b,, en los instantes f,, . . - , £,,, y la ecuación (8) se cumple aproximadamente: 


Ce + Det == by 
Ax=b es : 
Cen + Det 7 bm. 

Si hay más de dos lecturas, m > 2, entonces con toda probabilidad no es posible re- 
solver para C y D. Sin embargo, el principio de mínimos cuadrados proporciona valores 
óptimos E y D 

La situación sería completamente diferente si se conocieran las cantidades C y D, y 
estuviera intentándose descubrir las tasas de desintegración A y ¡u. Este es un problema de 
mínimos cuadrados no lineales, y es más difícil. Sin embargo, aún se forman E?, y la su- 
ma de los cuadrados de los errores, y se minimizan. Pero igualar a cero las derivadas no 
proporciona ecuaciones lineales para las A y ju Óptimas. En los ejercicios sólo se conside- 
ran mínimos cuadrados lineales. 


Mínimos cuadrados ponderados 


Un problema sencillo de mínimos cuadrados es estimar Xx del peso de un paciente a partir 
de dos Observaciones, x = b, y x = b,. A menos que b, = b,, la situación supone resolver 
un sistema inconsistente de dos ecuaciones en una incógnita: 


a] [x] = El 


Hasta el momento, b, y b, se han aceptado como igualmente confiables. Se buscaba el va- 
lor Y que minimizaba E? = (x — bi)? + (x — ba)”: 

dE? 0 0% bi + b, 

EF E A E 
El X óptimo es el promedio. La misma conclusión se obtiene a partir de ATAZ = ATb. De 
hecho, AYA no es una matriz de 1 por 1, y la ecuación normal es 2% = by + b,. 

Ahora se supone que dos observaciones no son confiables en la misma medida. El va- 
lor x = b; puede obtenerse a partir de una escala más precisa, o bien, en un problema es- 
tadístico, de una muestra más grande, que x = ba. A pesar de ello, si b, contiene alguna 
información, no es aconsejable depender totalmente de b,. El compromiso más sencillo es 
asignar valores distintos w? y w2, y escoger Xw que minimice la suma ponderada de cua- 
drados: 





j 
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PASADO CMI VIA! Draco RO ARE EME o LA 


Error ponderado E? = wí(x — by? + wUx — b,)?. 


Si w, > w, entonces a b, se asigna mayor importancia. El proceso de minimización (de- 
rivada = 0) intenta con mayor ahínco hacer pequeño a (x — by: 
dE? 


E 2[witx — b1) + wi(x —b2)] =0 en 


A Ri 
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Bl 
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En vez del promedio de b, y b, (para w, = wa, = 1), Xy es un promedio ponderado de 
los datos. Este promedio está más próximo de b, que de b,. 
El problema normal de mínimos cuadrados que llevaba a Xy proviene de cambiar 


Ax = b al nuevo sistema WAx = Wb. Con esto, la solución cambia de X a Xy. La matriz 
WW se voltea sobre ambos lados de las ecuaciones normales Po 






5 cd por mínimos cuadrados de Wax = -Wb e es Es > 





> Ecuaciones normales ponderads: car y ma) hy = 4 A Wo. 

¿Qué ocurre con la representación de b in en Ax? La proyección AXw sigue 
siendo el punto en el espacio columna más próximo a b. Pero la expresión “más próximo” 
adquiere un nuevo significado cuando la longitud implica a W. La longitud ponderada de x 
es igual a la longitud ordinaria de Wx. Perpendicularidad ya no significa y'x = 0; en el nue- 
vo sistema la prueba es (Wy)*(Wx) = O. La matriz W"W aparece en medio. En este nuevo 
sentido, la proyección AXw y el error b — AXy nuevamente son perpendiculares. 

El último párrafo describe todos los productos internos: provienen de matrices inver- 
tibles W. Sólo implican a la combinación simétrica C = WW. El producto interno de x y 
y es y*Cx. Para una matriz ortogonal W = O, cuando esta combinación es C = 00 =1, 
el producto interno no es nuevo O diferente. La rotación del espacio deja sin cambio al pro- 
ducto interno. Cualquier otra W cambia la longitud y el producto interno. 


Para cualquier matriz invertible W, estas reglas definen un nuevo producto interno y una 
nueva longitud: 


Ponderado por W  (x, y)w =(Wy)(Wx) y law = Wax. (10) 


Debido a que W es invertible, a ningún vector se asigna la longitud cero (excepto al vector 
cero). Todos los productos internos posibles —que dependen linealmente de x y y — son po- 
sitivos cuando x = y + O, y se encuentran de esta manera, para alguna matriz C = WWw. 

En la práctica, la cuestión importante es la elección de C. La mejor respuesta provie- 
ne de los expertos en estadística, originalmente de Gauss. Puede saberse que el error me- 
dio es cero. Este es el “valor esperado” del error en b, ¡aunque en realidad se espera que el 
error no sea cero! También es posible conocer el promedio del cuadrado del error; ésta es 
la varianza. Si los errores en las b,son independientes entre sí, y sus varianzas son 0, en- 
tonces los pesos correctos son w; = 1/0; Una medición más precisa, que significa menor 
varianza, obtiene un mayor peso. 

Además de tener confiabilidad desigual, las observaciones pueden no ser indepen- 
dientes. Si los errores vienen por parejas —las encuestas para presidente no son indepen- 
dientes de las encuestas para senador, y ciertamente tampoco de las encuestas para 
vicepresidente— entonces W tiene términos fuera de la diagonal. La mejor matriz no ses- 
gada C = WWW es la inversa de la matriz de covarianza, cuyo elemento i, j es el valor es- 
perado de (error en b,) multiplicado por (error en b,). Entonces, la diagonal principal de € e 
contiene a las varianzas 0?, que son el promedio de (error en By? 


Ejemplo 3 Suponga que dos compañeros en una partida de bridge conjeturan (después de pujar) la 
cantidad de picas que tienen. Para cada conjetura, los errores —1, O, 1 pueden tener la mis- 
ma probabilidad, 3- Así, el error esperado es cero y la varianza es E : 


Ele) = 4-1) + 3(0) + 3(1) =0 
Ele”) = K-1)? + 40)? +30)? = 


un 
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Las dos conjeturas son dependientes, porque están basadas en la misma puja, pero no son 
idénticas, porque los compañeros tienen manos distintas. Considere que la posibilidad de 
que los compañeros tengan muchas picas o tengan pocas picas es cero, pero que la posi- 
bilidad de errores opuestos es 3 Entonces Ele¡e,) = == 1), y la inversa de la matriz de 


covarianza es W*W: 
o 2 4 
Ele) Elesea)] ASES Ss E E C=w"w. 
Eleje2) Ele) io 2 L.2 
Esta matriz va en medio de las ecuaciones normales ponderadas. 


| Conjunto de problemas 3.3 





1. Encuentre la mejor solución por mínimos cuadrados Xx de 3x = 10, 4x = 5. ¿Cuál es 
el error E? que se minimiza? Compruebe que el vector error (10 — 32,5 — 4X) es 
perpendicular a la columna (3, 4). 


2. Suponga que los valores b, = 1 y b, = 7 multiplicados por t, = 1 y t, = 2 son ajus- 
tados por una recta b = Dt que pasa por el origen. Resuelva D = 1 y 2D = 7 por mí- 
nimos cuadrados. Dibuje la mejor recta. 


3. Resuelva Ax = b por mínimos cuadrados, y encuentre p = AX si 


1 0 l 
A=|0 li, b= 1. 
¡A 0 


Compruebe que el error b — p es perpendicular a las columnas de A. 


4. Escriba E? = l|Ax — bll? e iguale a cero sus derivadas respecto de u y v, si 





1 0 A 1 
A= [0 17, x= Al b= 131, 
1 1 4 
Compare las ecuaciones resultantes con AT4X = A*b, confirmando que el cálculo, 


É 
así como la geometría, proporcionan las ecuaciones normales. Encuentre la solución | 
x y la proyección p = AX. ¿Por qué p = b? 


¿ 
i 
é 


5. El siguiente sistema no tiene solución: E 


EZ 4 
O | = AS 
11 9 


Dibuje y resuelva un ajuste por una recta que lleve a la minimización de la cuadrática 
(C-D-4)+(C - 5) +(C + D — 9)?. ¿Cuál es la proyección de b sobre el 
espacio columna de 4? 


6. Encuentre la proyección de b sobre el espacio columna de A: 


1 l 
A = E br e 
7 
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Separe b en p + q, con p en el espacio columna y q perpendicular a este espacio. ¿Cuál 
de los cuatro subespacios contiene a q? 


Encuentre la matriz proyección P sobre el espacio generado por a, = (1,0, 1) y a, = 
CE 


Si P es la matriz proyección sobre un subespacio k-dimensional S de todo el espacio 
R”, ¿cuál es el espacio columna de FP y cuál es su rango? 


a) Si P = PYP, demuestre que P es una matriz proyección. 
b) ¿Sobre qué subespacio proyecta la matriz P = 07? 


Si los vectores a,, a», y b son ortogonales, ¿cuáles son AYA y A*b? ¿Cuál es la pro- 
yección de b sobre el plano de a, y a,? 


Suponga que P es la matriz proyección sobre el subespacio S y que O es la matriz pro- 
yección sobre los complementos ortogonales S”, ¿Cuáles son P + O y PO? Demues- 
tre que P — O es su propia inversa. 


S1 Y es el subespacio generado por (1, 1, 0, 1) y (0, O, 1, 0), encuentre 
a) Una base para el complemento ortogonal V?, 

b) La matriz proyección P sobre V. 

c) El vector en V más próximo al vector b = (0, 1,0, —1) en V-. 


Encuentre el mejor ajuste por una recta (mínimos cuadrados) de las mediciones 


b=4 en t=-2, b=3 en 1=-l, 
b=1l en £=0, b=0 en f£=2. 


!l 


Luego encuentre la proyección de b = (4, 3, 1, 0) sobre el espacio columna de 


lr — 
ot -1 
ae LL 
IA 


Los vectores a, = (1, 1, 0) y a, = Cl, 1, 1) generan un plano en R?. Encuentre la ma- 
triz proyección P sobre el plano, y encuentre un vector b diferente de cero que sea pro- 
yectado en cero, 


Si P es la matriz proyección sobre una recta en el plano x-y, dibuje una figura para des- 
cribir el efecto de la “matriz reflexión” H = T- 2P. Explique geométrica y algebrai- 
camente por qué 4? = 1, 


Demuestre que si la longitud de u es uno, entonces la matriz P = uu* de rango 1 es 
una matriz proyección: tiene las propiedades 1) y 11) enunciadas en 3N. Si se escoge 
u = a/ llal|, P se convierte en la matriz proyección sobre la recta que pasa por a, y Pb 
es el punto p = Xa. Las proyecciones de rango 1 corresponden exactamente a proble- 
mas de mínimos cuadrados en una incógnita. 


¿Qué matriz de 2 por 2 proyecta el plano x-y sobre la recta de 45% x + y = 0? 
Se quiere ajustar un plano y = C + Dti + Ez para los cuatro puntos 


y=3 en :t=1l,2=1l y=6 en £¿=0, 
y=5 en ¿=2, z = =0 


1 
puro 
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19, 


20. 


21. 


22. 


2 


PAN 


26. 


a) Encuentre 4 ecuaciones en 3 incógnitas para hacer pasar un plano por los puntos 
(en caso de que tal plano exista). 

b) Encuentre 3 ecuaciones en 3 incógnitas para la mejor solución por mínimos cua- 
drados. 


Si Po = A(A7A) lA? es la proyección sobre el espacio columna de A, ¿cuál es la pro- 
yección Pz sobre el espacio renglón? (¡No es PL!) 


Si P es la proyección sobre el espacio columna de A, ¿cuál es la proyección sobre el 
espacio nulo izquierdo? 


Suponga que L, es la recta que pasa por el origen en la dirección de a, y que £, es la 
recta que pasa por b en la dirección de a,. Para encontrar los puntos más próximos x/0y 
y b + x,a, sobre las dos rectas, escriba las dos ecuaciones para x, y x2 que minimizan 


xa, — x247 — b!|. Resuelva para x sia, = (1, 1, 0), a, = (0, 1, 0), b = (2, 1, 4). 
Encuentre la mejor recta C + Dt para ajustar b = 4, 2, —1, 0, O en los instantes 1 = 
e E 0 ERA 


Demuestre que el mejor ajuste por mínimos cuadrados a un conjunto de mediciones 
Yi» - - + > Jm por una recta horizontal (una función constante y = C) es su promedio 
Yi Fes A 

o e 


Co= 


Encuentre el mejor ajuste por una recta a las siguientes mediciones, y dibuje su solución: 
y= 2 en t31 y= 0 en 1=0, 
y=-3 en ¿=1, y==-3. en t=2. 


Suponga que en vez de, por medio de una recta, los datos del problema 24 se ajustan 
por una parábola: y = C + Dt + Ef. En el sistema inconsistente Ax = b proveniente 
de las cuatro mediciones, ¿cuáles son la matriz de coeficientes A, el vector desconocl- 
do x, y el vector de datos b? No es necesario calcular X. 


Bajo tortura, una persona de la Edad Media fue alargada las longitudes L = 5, 6, y 7 
pies bajo fuerzas aplicadas de F = 1, 2, y 4 toneladas. Suponga la ley de Hooke L = 
a + bF para encontrar por mínimos cuadrados la longitud normal a de la persona. 


En los problemas 27 a 31 se presentan los conceptos básicos de la estadística: la base 
de los mínimos cuadrados. 


27. 


28. 


29. 


(Recomendado) Este problema proyecta b = (b;,..., b,,) sobre la recta que pasa por 
a =(1,..., 1). Se resuelven m ecuaciones ax = ben 1 incógnita (por mínimos cua- 
drados). 


a) Resuelva aTax = aTh para demostrar que X es la media (el promedio) de las bs. 

b) Encuentre e = b — ax, la varianza |lel”, y la desviación estándar lel|. 

Cc) La recta horizontal b = 3 es la más próxima a b = (1, 2, 6). Compruebe que p = 
(3, 3, 3) es perpendicular a e, y encuentre la matriz proyección P. 

Primera suposición detrás de los mínimos cuadrados: La media de cada error de me- 

dición es cero. Multiplique los 8 vectores error b— Ax =(+1.+1. +1) por 


(A47A)7!4* para demostrar que el promedio de los 8 vectores Y — x también es cero. 
La estimación X es insesgada. 


Segunda suposición detrás de los mínimos cuadrados: Los m errores e, son indepen 
dientes de la varianza 0”, de modo que el promedio (b — AxMb — Ax)” es a?f Multi- 
plique por la izquierda por (4*4)714* y por la derecha por A(ATA)7*! para demostrar 
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31. 
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que el promedio de (X—xMX—x)* es 0o*(A7A)7?. Esta es la fundamental matriz de 
covarianza para el error en X. 


Un doctor toma 4 lecturas del ritmo cardiaco de una persona. La mejor solución de 
x=b,,...,x = b¿esel promedio x de b,,..., ba. La matriz A es la columna de 1s. 
En el problema 29 se proporciona el error esperado (x — x)? como o(ATA)"! = 
_____. Al promediar, la varianza cae desde o” hasta 0/4. 


S1 se conoce el promedio Xy de 9 números b,,..., bo, ¿cuán rápido puede encontrarse 
el promedio x¡y con un número más b,p? La idea de mínimos cuadrados recurrentes es 


evitar la suma de 10 números. ¿Qué coeficiente de xy proporciona correctamente X¡p? 


Lio = bro + _%9 = S(b1 ++: +b10). 


En los problemas 32 a 37, use cuatro puntos b = (0, 8, 8, 20) para producir ideas nuevas, 


32. 


39: 


35, 


36. 


E 


38. 


39, 


40. 


41. 


Con b = 0, 8, 8, 20 en : = O, 1, 3, 4, escriba y resuelva las ecuaciones normales 
ATAX = ATb. Para la mejor recta como en la figura 3.9a, encuentre sus cuatro altu- 


ras p, y sus cuatro errores e. ¿Cuál es el valor mínimo E? =ef + ef + ej + ez? 


(La recta C + Di pasa por los ps). Con b = 0, 8, 8, 20 en los tiempos £ = O, 1, 3, 4, 
escriba las cuatro ecuaciones Ax = b (irresoluble). Cambie las mediciones a p = 1, 5, 
13, 17 y encuentre una solución exacta de AX = p. 


Compruebe que e = b- p = (— 1,3, —3, 3) es perpendicular a ambas columnas de A. 
¿Cuál es la distancia más corta |le!]| de b al espacio columna de A? 


Para la parábola más próxima b = C + Dt + Et? a los mismos cuatro puntos, es- 
criba las ecuaciones irresolubles Ax = b en tres incógnitas x = (C, D, E). Escriba las 
tres ecuaciones normales ATAX = ATb (no se requiere su solución). Ahora se está 
ajustando una parábola a los cuatro puntos; ¿qué ocurre en la figura 3.9b? 


Para la cúbica más próxima b = C + Dt + Et? + Ft? a los mismos cuatro puntos, 
escriba las cuatro ecuaciones Ax = b. Resuélvalas por eliminación. Ahora, esta cúbl- 
ca pasa exactamente por los puntos. ¿Cuáles son p y e? 


El promedio de los cuatro tiempos es ? = 1(0 +1 +3 +4) = 2, El promedio de 
las cuatro bs es hb = ¿(0 +8+8+20) =9. 

a) Compruebe que la mejor recta pasa por el punto central (7, b) = (2, 9). 

b) Explique por qué C + Dí = b proviene de la primera ecuación en ATAX =A?»b, 


¿Qué ocurre con el peso ponderado Xy = (w*b, + w3b2)/(w% + 13) si el primer pe- 
so wy tiende a cero? La medición b, es completamente desconfiable. 


A partir de 1 mediciones independientes b,, ..., bj, del pulso de una persona, pon- 
deradas por W;,... , W,, ¿Cuál es el promedio ponderado que sustituye a la ecuación 
(9)? La respuesta es la mejor estimación cuando las varianzas estadísticas son 


oa? =1/w/. 


SiW = lo A , encuentre el producto interno de x = (2, 3) y y = (1, 1), así como 


la longitud W de x. ¿Qué recta de vectores es W-perpendicular a y? 


Encuentre la solución ponderada por mínimos cuadrados Xy de Ax = b: 
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1250 0 2 E ES, 
A=|1 1 b=|1 W=H10 1 0]. 
E 2 J 01 


Compruebe que la proyección AXy sigue siendo perpendicular (¡en el producto inter- 
no W!) al error b — AXy. 


42. a) Suponga que usted adivina la edad de su profesor, cometiendo errores e = —2, —1, 


5, con probabilidades 3, ¿, 5. Compruebe que el error esperado Ele) es cero, y 
encuentre la varianza E(e?). 
b) Si también el profesor adivina (o intenta recordar), cometiendo errores —1, 0, 1, 


con probabilidades 5 o, z> ¿qué pesos w, y ws proporcionan la confiabilidad de 


su conjetura, así como la confiabilidad de la conjetura del profesor? 


3.4 BASES ORTOGONALES Y GRAM-SCHMIDT 


En una base ortogonal, todos los vectores son perpendiculares entre sí. Los ejes de coorde- 
nadas son mutuamente ortogonales. Esta situación es casi óptima, y la única mejoría es fá- 
cil de realizar: cada vector se divide entre su longitud con la finalidad de hacerlo un vector 
unitario. Así se cambia una base edi a una base ortonormal de qs: 











o Sica que¡ Aj 3d 
1d q; Ñ 1 siempre que = Je 0 
al Ina matriz con columnas ortonormales se denomina ed EE 

El ejemplo más importante es la base estándar. Para el plano x-y, los ejes más cono- 
cidos e, = (1, 0) y e, = (0, 1) no sólo son perpendiculares, sino que también son horizon- 
tal y vertical, respectivamente. O es la matriz identidad de 2 por 2. En n dimensiones, la 


base estándar €e,,..., €, nuevamente consta de las columnas de O = I: 
1 0 0 
0 1 0 
Base e, > O : e) = 0 a pd En = O 
estándar . . . 
0 0 1 


¡Esta no es la única base ortonormal! Es posible rotar los ejes sin modificar los ángulos rec- 
tos a los que se cortan. Estas matrices rotación constituyen ejemplos de Q. 

Si se tiene un subespacio de R”, los vectores estándar e; pueden no estar en ese subes- 
pacio. Sin embargo, el subespacio siempre tiene una base ortonormal, que puede construir- 
se en forma sencilla a partir de cualquier base dada. Esta construcción, que transforma un 
conjunto sesgado de ejes en un conjunto perpendicular, se denomina ortogonalización de 
Gram-Schmidt. 

En resumen, los tres tópicos fundamentales de esta sección son: 


1. La definición y las propiedades de las matrices ortogonales O. 
2. La solución de Ox = b, ya sea de n por n o rectangular (mínimos cuadrados). 
3. El proceso de Gram-Schmidt y su interpretación como una nueva factorización A = OR. 
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Ejemplo 1 


Ejemplo 2 
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Matrices ortogonales 





Cuando el renglón ¡ de Q* multiplica a la columna j de O, el resultado es qlg, = 0. 
Sobre la diagonal, donde i = j, se tiene gg; = 1. Esta es la normalización a vectores uni- 
tarios de longitud 1. 

Observe que O*O = T incluso si O es rectangular, Pero entonces O” es sólo una inver- 
sa izquierda. 


_|cosó —senó Ta last ll cos O. semQ 
2 bar sra : 2o0=0"= Bs a 
O hace girar a todo vector un ángulo 9, y O* lo hace girar de regreso un ángulo —9. Resul- 
ta evidente que las columnas son ortogonales, y son ortonormales porque sen? 9 + cos? 
9 = 1. La matriz O” es justo una matriz tan ortogonal como lo es O. 


Cualquier matriz permutación P es una matriz ortogonal. Ciertamente, las columnas son 
vectores unitarios y ortogonales, ya que el 1 aparece en un sitio distinto en cada columna: 
La traspuesta es la inversa. 


0 10 0001 
Si P=|0 O 1lentonces P*=P"=|1 0 0 
DO 50 0-.E-0 


Una P antidiagonal, con P,3 = P»,, = P31 = 1, lleva los ejes x-y-z en los ejes z-y-x: 
un sistema “derecho” en un sistema “izquierdo”. Por tanto, hubiera sido erróneo sugerir 
que cada O ortogonal representa una rotación. También se permite una reflexión. 


o 1 , é 
de : | refleja cada punto (x, y) en (y, x), su imagen especular a través de la recta a 


45”. Geométricamente, una Q ortogonal es el producto de una rotación y una reflexión. 


Queda por abordar una propiedad compartida por las rotaciones y las reflexiones, y de 
hecho, por cualquier matriz ortogonal. No es compartida por las proyecciones, que no son 
ortogonales y ni siquiera invertibles. Las proyecciones reducen la longitud de un vector, 
mientras que las matrices ortogonales poseen una propiedad que es la más importante y ca- 
racterística de todas: 


- 





"Matriz ortonormal hubiera sido un mejor nombre, pero ya es demasiado tarde para cambiar. También, no hay una 
denominación aceptada para una matriz rectangular con columnas ortonormales. Seguimos escribiendo Q, pero 
no se denominará “matriz ortogonal” a menos que sea cuadrada. 
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E ] ar La a multiplicación p por x cualquier O preserva las longitudes 
19x1 | = 


ad preserva productos internos y “ángulos. 


Longitudes. sin carabio 











La preservación de longitudes proviene directamente de QQ = 
1QxI1? = ]x1? debido a que (Qx)'(Qx) =x"0%Qx =x'x. (3) 


Cuando el espacio se gira o refleja, se preservan todos los productos internos y las longi- 


tudes. 

A continuación se abordará el cálculo en que se utiliza la propiedad especial Q* = 
O” ?. Si se tiene una base, entonces cualquier vector es una combinación de los vectores de 
la base. Esto es excepcionalmente simple para una base ortonormal, lo cual será un con- 
cepto clave detrás de las series de Fourier. El problema es encontrar los coeficientes de los 


vectores de la base: 


b se escribe como una combinación b= xq, + x2q2 + +** + Xan. 


Para calcular x, hay un truco evidente. Ambos lados de la ecuación se multiplican por q. 
En el miembro izquierdo está q b. En el miembro derecho todos los términos desapare- 
cen (porque 9, q; = 0) excepto el primer término. Lo que queda es 





qaib=xq|q1. 


Debido a que q!g; = 1, se ha encontrado que x, = q]b. De manera Ra el segun- 
do coeficiente es x2 = q] b; este término permanece cuando se multiplica por q. Los otros 
términos desaparecen por la ortogonalidad. Cada pieza de b tiene una fórmula sencilla, y 
al recombinar las ai se E b: 


SRA 





Todo: vector bes iguala a: ; al Das * 





No do resistir escribir esta base ortonormal en una matriz cuadrada 201 La e cuáción 
vectorial xq, + *** +xaGn = b es idéntica a Qx = b. (Las columnas de O multiplican a 
las componentes de x). Su solución es x = Q”*b, Pero como Q7* = O” —aquí es donde en- 
tra la ortonormalidad— la solución también es x = Q?b: 

A qib 
=Q'b= e (5) 
da qn? 
Las componentes de x son los productos internos 9; b, como en la ecuación (4). 

La forma matricial también muestra lo que ocurre cuando las columnas no son orto- 
normales. Expresar b como una combinación x,41 + *** +xpa, es lo mismo que resolver 
Ax = b. Los vectores de la base se van en las columnas de A. En ese caso, se requiere A”?, 
lo cual cuesta trabajo. En el caso ortonormal sólo se requiere O”. 








Observación 1 La razón a*b/a* a ya apareció antes, cuando bh se proyectó sobre una rec- 
ta. Aquí a es q,, el denominador es 1 y la proyección es (9Fb)q1. Por tanto, se tiene una 
nueva interpretación de la fórmula (4): Todo vector b es la suma de sus proyecciones uni- 
dimensionales sobre las rectas que pasan por las qs. 
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Debido a que estas proyecciones son ortogonales, el teorema de Pitágoras sigue siendo 
válido. El cuadrado de la hipotenusa sigue siendo la suma de los cuadrados de las compo- 
nentes: 


IB? =(qrbY + (ab +---+(qiby? quees  I1Q*bll. (6) 


Observación 2 Debido a que Q* = Q”!, también se tiene que QQ” = 7. Cuando O vie- 
ne antes que Q*, la multiplicación toma les productos internos de los renglones de O. (Pa- 
ra O*O eran las columnas.) Ya que el resultado es nuevamente la matriz identidad, se llega 
a una conclusión sorprendente: Los renglones de una matriz cuadrada son ortonormales 
siempre que lo sean las columnas. Los renglones apuntan en direcciones completamente 
distintas a las de las columnas, y geométricamente no veo por qué están obligados a ser or- 


tonormales, pero lo son. 
Columnas ortonormales 1UYV3 UY 146 


Renglones ortonormales 0 = 1/43 o  -—2/46 
143 -UY2  1vV6 


Matrices rectangulares con columnas ortonormales 


Este capítulo es sobre Ax = b, cuando A no necesariamente es cuadrada, Para Ox = b aho- 
ra se admite la misma posibilidad: puede haber más renglones que columnas. Los n vecto- 
res ortonormales q, en las columnas de O tienen m > n componentes. Así, O es una matriz 
de m por n y no es de esperar poder resolver Ox = b de manera exacta. Se resuelve por mí- 
nimos cuadrados. 

Si hay justicia, las columnas ortonormales deben hacer más sencillo el problema. Fun- 
cionó para matrices cuadradas, y ahora funcionará para matrices rectangulares. La clave 
consiste en observar que se sigue teniendo O*Q = 1. Así, O” sigue siendo la inversa iz- 
quierda de O. 

Para mínimos cuadrados, esto es todo lo que se necesita. Las ecuaciones normales se 
presentaron al multiplicar Ax = bh por la matriz traspuesta, para obtener ATAX = ATh. 
Ahora las ecuaciones normales son QT Q% = OTb, ¡Pero O*Q es la matriz identidad! En 
consecuencia, X = O*b, ya sea que O es cuadrada y si X es una solución exacta, o si O 
es A A se o mínimos OS 











b 
O*b 
=0O'b ¿5 A SÍ : 

Qx ola proyección « de bes. (a? br 
== 2 29» lar matriz sl es. 5. 20 






1 






ll 













Las últimas fórmulas son como p = AX y P = SATA) -1 47, Cuando las columnas son 
ortonormales, la “matriz producto cruz” ATA se convierte en Q*O = 1. La parte difícil de 
los mínimos cuadrados desaparece cuando los vectores son ortonormales. Las proyeccio- 
nes sobre los ejes no se presentan por pares, y p es la suma p = (gTb)g, + -** +(q,b)qn. 

Se recalca que estas proyecciones no reconstruyen b. En el caso cuadrado m = n sí lo 
hacían. En el caso rectangular m > n no lo hacen. Proporcionan la proyección p y no el 
vector original b, que es todo lo que puede esperarse cuando hay más ecuaciones que in- 
cógnitas, y las gs dejan de ser una base. La matriz proyección suele ser ACATaAyrA?, 


A A 
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y aquí se simplifica a 






(7) 


Observe que OT O es la matriz identidad de n por n, mientras 00* es una matriz proyec- 
ción P de m por m. Es la matriz identidad sobre las columnas de Q (P las deja solas). Pero 
00” es la matriz cero sobre el complemento ortogonal (el espacio nulo de O”). 


Ejemplo 3 El siguiente caso es sencillo pero típico. Suponga que un punto b = (x, y, z) se proyecta so- 
bre el plano x-y. Su proyección es p = (x, y, 0), y esta es la suma de las proyecciones por 
separado sobre los ejes x y y: 





1 Xx 0 0 
n=|0| y (aibiq=|0|; q=|l] y (qblq=|y]. 
0 0 0 0 
La matriz proyección global es 
POTONAO bs 5 
P=qui+quq7 =|0 1 01, y Ply|=|y]. 
9-00 z O 


Proyección sobre un plano = suma de las proyecciones sobre q, y q, ortonormales. 


Ejemplo 4 Cuando el promedio de los tiempos de medición es cero, ajustar una recta conduce a co- 
lumnas ortogonales. Considere f, = —3, t, = 0, ty = 3. Luego, el intento de ajustar y = 
C + Dt produce tres ecuaciones en dos incógnitas: 


+ Dt; a] iS C Y: 
C+Dt= y, obien, [1 0 A A e 
C + Dt = ya j a y3 


| 
| 


Las columnas (1, 1, 1) y (3, 0, 3) son ortogonales. Es posible ; proyectar y por separado 
sobre cada columna, de modo que los mejores coeficientes € y D pueden encontrarse por 
separado: 


a. e 
12 +12 + 12 f (-3)2 +02 + 32 


o 


Observe que C = (y + ya + y3)1/3 es la media de los datos. E proporciona el mejor 
ajuste por una recta horizontal, mientras Dt es el mejor ajuste por una recta que pasa por 
el origen. Las columnas son ortogonales, de modo que la suma de estas dos piezas por se- 
parado constituye el mejor ajuste por cualquier recta. Las columnas no son vectores uni- 
tarios, por lo que € y D tienen la longitud al cuadrado en el denominador. 


SE PO ¿UA TIO ARTIC EPR 7 


Las colunmas ortogonales son en mucho mejores, tanto que merece la pena cambiar a 
ese caso. Si el promedio de los tiempos de observación no es cero —<s Í = (t, +:--+ 


t)/ m-— entonces el origen del tiempo puede cambiarse por 7. En vez de y = C + Dt se 


trabaja con y = Cc + d(t — £). ¡La mejor recta es la misma! Así como en el ejemplo, se en- 
cuentra 


A A A A en AMP + 


mr a 


$ 
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Y 
EI AO Dee 
12 + 124... +]2 m 
a E 
IAS A, O (8) 
ia US A 


El mejor € es la media, y también se obtiene una fórmula conveniente para d.. Los elemen- 
tos fuera de la diagonal de la AA anterior eran Xt, y al cambiar el tiempo por 7 estos ele- 
mentos se hacen cero. Este cambio es un ejemplo del proceso de Gram-Schmidt, que 
ortogonaliza la situación de antemano. 

Las matrices ortogonales son cruciales en álgebra lineal numérica, ya que no introdu- 
cen inestabilidad. Mientras las longitudes permanecen igual, el redondeo está bajo control. 
La ortogonalización de vectores se ha convertido en una técnica esencial. Quizá sólo esté 
en segundo lugar, detrás de la eliminación; y conduce a una factorización A = OR que es 
casi tan famosa como 4 = LU, 


El proceso de Gram-Schmidt 


Suponga que se tienen tres vectores independientes a, b, c. Si son ortonormales, las co- 
sas son fáciles. Para proyectar un vector y sobre el primero, se calcula (a*v)a. Para pro- 
yectar el mismo vector v sobre el plano de los dos primeros, simplemente se suma 
(avda + (bYwb. Para proyectar sobre lo generado por a, b, c, se suman tres proyeccio- 
nes. Todos los cálculos sólo requieren los productos internos a*v, bYv, y cv. Pero para ha- 
cer realidad esto, es obligado decir: “Si son ortonormales.” A continuación se propone 
encontrar una manera de hacerlos ortonormales. 

El método es sencillo. Se tienen a, b, e y se buscan q1, 97, 93. Con q, no hay proble- 
ma: puede ir en la dirección de a. Se divide entre la longitud, de modo que q; = a/ llal| es 
un vector unitario. El verdadero problema empieza con q», que debe ser ortogonal a q,. Si 
el segundo vector b tiene cualquier componente en la dirección de q, (que es la dirección 
de a), es necesario restar esa componente: 


Segundo vector  B=b-—(q bg, y  q2=B/IBIl. (9) 


B es ortogonal a q;. Es la parte de b que va en una nueva dirección, y no en la dirección de 
a. En la figura 3.10, B es perpendicular a q,. Establece la dirección para ga. 





Figura 3.10 La componente q, de b se elimina; a y B se normalizan en q; y 92- 


En este punto ya se cuenta con q; y q. La tercera dirección ortogonal empieza con c. 
No está en el plano de q; y q, que es el plano de a y b. No obstante, puede tener una com- 
ponente en ese plano, y ésta, debe restarse. (Si el resultado es C = 0, esto indica que a, b, 
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Ejemplo 5 


c no eran independientes desde el principio.) Lo que queda es la componente C que se bus- 
ca, la parte que está en una nueva dirección perpendicular al plano: 


Tercer vector C=c—(qicldqi—(q0q2 y  q3=C/WMCI (10) 
Esta es la idea de todo el proceso de Gram-Schmidt; restar de cada vector nuevo sus com- 


ponentes en las direcciones ya establecidas. Esta idea se utiliza una y otra vez.” Cuando se 
tiene un cuarto vector, se restan sus componentes en las direcciones de q, q2, 93. 


Gram-Schmidt Suponga que los vectores independientes son a, b, c: 


1 1 Z 
a= |j0l, b=Jj01, c=|11. 
0 0 


Para encontrar q,, el primer vector se hace unitario: q, = a/ a/2. Para encontrar q», del se- 
gundo vector se resta su componente en la primera dirección: 


1 1 1/42 1 Í 
B=b-(q bg: =l0| -—=]| O | ==] Ol. 
ol lygal 211 
El q, normalizado es B dividido entre su longitud, para producir un vector unitario: 
132 
0 ; 
1/42 


Para encontrar q3, de c se resta su componente a lo largo de q, y q»: 


q > 


C=c- (qq, — laca 


2 1/2 12 0 
EE A A A OS 0 = |11. 
0 YWIJZ 1/42 0 


Este vector ya es unitario, de modo que es 93. Acudí a longitudes desesperadas para dismi- 
nuir el número de raíces cuadradas (la parte penosa del proceso de Gram-Schmidt). El re- 
sultado es un conjunto de vectores ortonormales q,, q, q3, que van en las columnas de una 
matriz ortonormal O: 


1/42 1/42 0 
0 0 e 
1/42 -—1/42 0 


Base ortonormal O=lq4 q q3]| = 


"Sí Gram fue el primero que tuvo esta ídea, ¿qué le quedó a Schmidt? 
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Observación sobre los cálculos Considero que es más fácil calcular los ortogonales a, B, 
C, sin forzar a que sus longitudes sean iguales a 1. Luego, las raíces cuadradas entran sólo 
al final, cuando se divide entre esas longitudes. El ejemplo anterior debería tener las mis- 
mas B y C, sin utilizar raíces cuadradas. Observe el 3 de a*b/a*a en vez del we de q *b: 


A 2 1 5 
B=|0| - 3 Ol yentonces E = 11] =[01 =27P 0 
0 1 0 1 —! 


La factorización A = OR 


Se empezó con una matriz A, cuyas columnas eran a, b, c. Se termina con una matriz O, 
cuyas columnas son q, q2, q3. ¿Cuál es la relación entre estas matrices? Las matrices A y 
O son de m por n cuando los » vectores están en el espacio m-dimensional, y debe haber 
una tercera matriz que las relacione. 

La idea es escribir las as como combinaciones de las qs. El vector b en la figura 3.10 
es una combinación de los q; y q, ortonormales, y se sabe de cuál combinación se trata: 


=(qib)q, + [q1b)g2. 


Todo vector en el plano es la suma de sus componentes q, y q7. De manera semejante, c es 
la suma de sus componentes 31, 42, 93: c = (qTc)gí + (q1c)g2 + (g1c)g3- Si lo anterior 


se expresa en forma matricial, se tiene la nueva factorización A = OR: 


aja qjb aje 

Factores OR A=la b cl=lq q 3 ab qle| =OR (12) 
7 
q3 € 


¡Observe los ceros en la última matriz! R es triangular superior debido a la forma en que 
se realizó el proceso de Gram-Schmidt. Los primeros vectores a y q, están sobre la misma 
recta. Luego, q, y q, estaban en el mismo plano que a, b. Los terceros vectores, c y q3 no 
se requirieron sino hasta el paso 3. 

La factorización OR es como A = LU, excepto que el primer factor Q tiene columnas 
ortonormales. El segundo factor se denomina R, porque los elementos diferentes de cero 
están a la derecha de la diagonal (y la letra U ya se había utilizado). Los elementos fuera 
de R fuera de la diagonal son los números g Tb = 1/42 y qle = q3c = V2, que se en- 
contraron antes. Toda la factorización es 


y) UR. ROA Ya 
ll =] 0 0 1 14/42 v/2| = OR. 
0 MID ua. 1 
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Las longitudes de a, B, C se observan en la diagonal de R. Los vectores ortonormales q, 
92, 93, que constituyen todo el objeto de la ortogonalización, están en el primer factor O. 
Tal vez OR no es tan elegante como LU (debido a las raíces cuadradas). Ambas facto- 
rizaciones revisten una importancia crucial en la teoría del álgebra lineal, y absolutamente 
fundamental en los cálculos. Si LU es Hertz, entonces OR es Avis. 
Los elementos r;¡; = q? a; aparecen en la fórmula (11), cuando l1 4, lg, se sustituye 
por A;: 
aj = (qiajq +: Di +14 ,l1q,= Q Multiplicado por la columna ¿de R (13) 


Lera 






qua Ene OS OREA? 


.3U. “Toda matriz de m 2 por, n con A columnas. independientes pue d E 
EN A =QR. Las columnas de A son 'ortonormales, y Res. triangular. superior $ inver- pe 
y tible. Cúando: m= = y e todas las: matrices. son Cuadradas, Os se > convierte « en una ma-- 

ñ triz ortogonal, a TEO 1 ee, RA 


No debe olvidarse la cuestión más importante de la ortogonalización. Simplifica el 
problema de mínimos cuadrados a Ax = b. Las ecuaciones normales siguen siendo correc- 
tas, pero ATA se vuelve más fácil: 


ACA = REO OR = RR. (14) 
La ecuación fundamental ATAF = ATh se simplifica a un sistema triangular: 
RTRE=RTOFb obien RI=QTb. (15) 


En vez de resolver ORx = b, lo cual no es posible, se resuelve RX = Q*%b, lo cual supo- 
ne sólo sustitución hacia atrás porque R es triangular. El costo real lo constituyen las mn? 
operaciones del proceso de Gram-Schmidt, que son necesarias para encontrar en primer lu- 
garaQyaR. 

La misma idea de ortogonalidad se aplica a las funciones. Los senos y los cosenos son 
ortogonales; las potencias 1, x, 1? no lo son. Cuando f(x) se escribe como una combinación 
de senos y cosenos, se trata de una serie de Fourier. Cada término es una proyección so- 
bre una recta; la recta en el espacio de funciones que contiene múltiplos de cos nx o de sen 
nx. Esta situación es completamente paralela al caso vectorial, y es muy importante. Por úl- 
timo, se tiene una tarea para Schmidt: ortogonalizar las potencias de x y producir los poli- 
nomios de Legendre. 





Espacios de funciones y series de Fourier 


Esta sección es breve y opcional, aunque tiene varias buenas intenciones: 


; 
E 
É 
; 
Í 


1. Introducir el espacio vectorial de dimensión infinita más famoso (el espacio de Hil- 
berú), 

2. Extender los conceptos de longitud y producto interno de vectores v a funciones f(x); 

3. Identificar las series de Fourier como sumatorias de proyecciones unidimensionales 
(as “columnas” ortogonales son los senos y los cosenos); 

4. Aplicar el proceso de ortogonalización de Gram-Schmidt a los polinomios 1, x, O 

5. Encontrar la mejor aproximación a f(x) mediante una recta. 


2/7 ACA HIRE DO 2 


Trataremos de seguir este esbozo, que abre una variedad de nuevas aplicaciones para 
el álgebra lineal de manera sistemática. 


1. Espacio de Hilbert. Luego de estudiar R”, resulta natural pensar en el espacio R”. 
Contiene a todos los vectores v = (v,, vz, U3, .. . ) con una sucesión infinita de componen- 
tes. En realidad, este espacio es demasiado grande cuando no hay control sobre el tamaño 


cra ito 90 A IA lp vo UA mer == IIS VU EA * Armed ot) 


e + 


yu 
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de las componentes v;. Una idea mucho mejor es preservar la conocida definición de lon- 
gitud, usando una suma de cuadrados, e incluir sólo aquellos vectores cuya longitud sea 
finita: 


Longitud al cuadrado [v? =v?.+u2+vu2+++-- (16) 


La serie infinita debe converger a una suma finita. Esto deja (E 3> 3, pos ) pero ño Cl. 1, 


l,. ..). Los vectores con longitud finita pueden sumarse (lv + wi] < llull + will) y mul- 
tiplicarse por escalares, de modo que forman un espacio vectorial. Es el célebre espacio de 
Hilbert. 

Este espacio es la forma natural para hacer que las dimensiones se vuelvan infinitas, y 
al mismo tiempo preservar la geometría del espacio euclidiano normal. Las elipses se con- 
vierten en elipsoides de dimensión infinita, y las rectas perpendiculares se reconocen exacta- 
mente como antes. Los vectores v y w son ortogonales cuando su producto interno es cero: 


Ortogonalidad vw = yw); ae V¿ Wa ES U3 03 Ho... =0(0, 


Se garantiza que esta sumatoria converge, y que para dos vectores cualesquiera sigue cum- 
pliendo la desigualdad de Schwarz |v*w| < |Iv!| |w!/|. El coseno, incluso en el espacio de 
Hilbert, nunca es mayor que 1. 

Hay otra cuestión extraordinaria respecto a este espacio: se presenta bajo numerosos 
disfraces. Sus “vectores” pueden ser funciones, lo cual es otra cuestión importante. 


2. Longitud y productos internos. Suponga que f(x) = sen x sobre el intervalo 0 <= x = 
271. Esta f es como un vector con todo un continuo de componentes, donde los valores de 
sen x están a lo largo de todo el intervalo. Para encontrar la longitud de un vector así, la re- 
gla de costumbre de sumar los cuadrados de las componentes se vuelve imposible. Esta su- 
matoria se sustituye, de forma natural e inevitable, por la integración: 


270 


2 
Longitud || £ |] de la función AP = / CUONYNi dx = (senxdM dx =z7x. (17) 
0 0 


El espacio de Hilbert se ha convertido en un espacio de funciones. Los vectores son fun- 
ciones, se cuenta con un método para medir su longitud, y el espacio contiene a todas aque- 
llas funciones de longitud finita, justo como en la ecuación (16). No contiene a las 
funciones F(x) = l/x, ya que la integral de 1/4 es infinita. 

La misma idea de sustituir la sumatoria por la integración produce el producto inter- 
no de dos funciones: Si f(x) = sen x y g(x) = cos x, entonces su producto interno es 


2w 2 
(Ae = fode) dx = il senxcosxdx = 0. (18) 
0 0 


Esto es exactamente como el producto interno vectorial f*g. Sigue estando relacionado con 
la longitud mediante (f, f) = | f [1?. La desigualdad de Schwarz se sigue cumpliendo: 
(4 2)1 < UFI lgll. Por supuesto, dos funciones como sen x y cos x, cuyo producto inter- 
no es cero, se denominan ortogonales. Incluso, son ortogonales después de la división en- 
tre su longitud /T. 


O serie de Fourier de una Iión es un desarrollo en senos y cosenos: 
FG) = = Sd + a cos x + bis senx. e a cos2x + bo sen2x iD 


Para calcular un coeficiente como a ambos miembros se multiplican por la función co- 
rrespondiente sen x y se integra desde O hasta 27r. (La función g(x) está dada en ese inter- 
valo). En otras palabras, se toma el producto interno de ambos miembros con sen x: 
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Zar 2 Zu 27 
fix)senx dx = ao | senx dx +a; al cos x senx dx +b, (senxY dx +... 
0 0 


0 0 


En el miembro derecho, cada integral es cero excepto una: donde sen x se multiplica a sí 
mismo. Los senos y los cosenos son mutuamente ortogonales, como en la ecuación (18): 
Por tanto b, es el miembro izquierdo dividido por aquella integral no cero: 


"fíx)senxdx (f,senx) 


e 242 
So (senx)? dx  (senx, sen x) 


El coeficiente de Fourier a, hubiera podido ser cos x en vez de sen x, y az hubiera podido 
ser cos 2x. 

Todo el asunto consiste en ver la analogía con las proyecciones. La componente del 
vector b a lo largo de la recta generada por a es b*alaTa. Una serie de Fourier proyecta 
F—c) sobre sen x. Su componente p en esta dirección es exactamente b, sen x. 

El coeficiente b, es la solución por mínimos cuadrados de la ecuación inconsistente b, 
sen x = f(x). Esto lleva a b, sen x lo más cerca posible de f(x). Todos los términos en la 
serie son proyecciones sobre un seno o un coseno. Debido a que los senos y los cosenos 
son ortogonales, la serie de Fourier proporciona las coordenadas del “vector” f(x) respec- 
to a un conjunto de (una infinidad de) ejes perpendiculares. 


4.  —Gram-Schmidt para funciones. Además de los senos y los cosenos, hay muchas fun- 
ciones útiles que no siempre son ortogonales. Las más sencillas son las potencias de x, y 
lamentablemente no existe ningún intervalo sobre el cual incluso 1 y “ sean perpendicu- 
lares. (Su producto interno siempre es positivo, ya que es la integral de 1%.) En consecuen- 
cia, la parábola más próxima a f(x) no es la suma de sus proyecciones sobre 1, x, y 1%. Hay 
una matriz como (A*A)”!, y su correlato está dado por la matriz de Hilbert mal acondi- 
cionada. Sobre el intervalo0=x= 1, 





1D (10 (197 [f1 fx $7 [44 
AA=l(xD (xx) (x,1) | =|fx fr fr|=|! 1 1 
E Ja 1 1 1 


Esta matriz tiene una gran inversa, ya que los ejes 1, x, 7 están lejos de ser perpendicula- 
res. La situación se vuelve imposible si se agregan unos cuantos ejes más. Es virtualmen- 
te inútil resolver ATAR = AYb para el polinomio más próximo de grado diez. 

Con más precisión, resulta inútil resolver esto por eliminación gaussiana; todo error 
por redondeo puede amplificarse por más de 10%. Por otra parte, no es posible rendirse y 
ya; la aproximación mediante polinomios debe ser posible. La idea correcta es cambiar a 
ejes ortogonales (con el proceso de Gram-Schmidt): Se buscan combinaciones de 1, x, 
1” que sean ortogonales. 

Resulta conveniente trabajar con un intervalo situado simétricamente como —1 <= x 
<= 1, ya que así todas las potencias impares de x se hacen ortogonales a todas las potencias 
pares: 


¿ 
E 
E 
i 
2 
E 
$ 
E 


CIAL PAIPA riada 


l 1 
1a-/ xdx =0, (7 =/ x dx =0. 


J k 


co Pr a E A A 


En consecuencia, el proceso de Gram-Schmidt puede empezar aceptando a v, = l y uv, = 
x como los dos primeros ejes perpendiculares. Debido a que (x, 1%) = O, sólo tiene los án- 
gulos correctos entre 1 y “. El tercer polinomio ortogonal es 
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1 
Ortogonalizar vz = x? => (, x2) ps A = e? poo Só dx = Y? == 1 
1D. Gn Ta 3 


Los polinomios que se construyen de esta manera se denominan polinomios de Legendre 
y son ortogonales mutuamente sobre el intervalo —1 <= x < 1. 


Comprobar e -f e dx = 2_x] =0 
a E o E: Ea RS 


Ahora ya es posible calcular el polinomio más próximo de grado 10, sin ningún desastre, 
al proyectar sobre los 10 (u 11) primeros polinomios de Legendre. 


5. Mejor recta. Suponga que se desea aproximar y = 7 mediante una recta C + Dx en- 
trex = 0 y x = 1. Hay por lo menos tres formas para encontrar esa recta, y si se comparan 
estas formas, entonces ¡todo el capítulo se aclara! 


1. Seresuelve[1 x][£¿] = x% por mínimos cuadrados. La ecuación ATAF = ATb es 


5 1 
A B Mol 
1D) (10D (137) D 
2. Seminimiza E? = fala -C-— DxJldx =-2¿C0-¿D+C2+CD+ 


3.D?.Las derivadas respecto a C y D, después de dividir entre 2, traen de regreso las 


ecuaciones normales del método 1 (y la solución es CT = ¿7% D = 2). 


1 1 1 
-¿+O+7D=0 y A ON 


ni 
uj— bi 
Ja Ahi 


eS És 


3. Se aplica el proceso de Gram-Schmidt para sustituir x por x — (1, /(1, 1). Esto es 
x= 5, que es ortogonal a 1. Luego, las proyecciones unidimensionales producen la 





mejor recta: 
(1%, 1) (o) ES 1 
= — ei: A. A — => o] A 7 
C+*Dx e o 5) 6 > (a 5) 


Conjunto de problemas 3.4 


1. a) Escriba las cuatro ecuaciones para ajustar y = C + Dt a los datos 


y=->24d en t=-2 y-=-3 en 1=-1 
y=-—1l en t=1, y=0 en 1=2, 


Demuestre que las columnas son ortogonales. 
b) Encuentre la recta Óptima, trace su gráfica, y escriba E”. 
c) Interprete el error cero en términos del sistema original de cuatro ecuaciones en dos 
incógnitas: el miembro derecho (—4, —3, —1, 0) está en el espacio 
1 
2. Proyecte b = (0, 3, 0) sobre cada uno de los vectores ortogonales a, = (3, 3, —3) y 
da = zs Zs 5), y luego encuentre su proyección p sobre el plano de a, y az. 
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3. Encuentre también la proyección de b = (0, 3, 0) sobre az = (3, —3, 3) y sume las 
tres proyecciones. ¿Por qué P = aja! +azal + aza] es igual a 1 


4. Si0, y O, son matrices ortogonales, de modo que OO = 7, demuestre que Q,0, tam- 
bién es ortogonal. Si O, es una rotación en un ángulo 0 y O, es una rotación en un án- 
gulo q, ¿a qué es igual O,0,? ¿Puede encontrar las identidades trigonométricas para 
sen (9 + b) y cos (0 + b) en la multiplicación de matrices QQ? 


5. Siues un vector unitario, demuestre que O = / — 2uu* es una matriz ortogonal simé- 
trica. (Es una reflexión, también conocida como transformación de Householder .) Calcu- 


le Q cuando u* =[3 3 —1 —1Í] 


6. Encuentre una tercera columna de modo que la matriz 


1/43  1/414 
O=|1/43  2/v414 
1/43 3/4/14 


sea ortogonal. Debe ser un vector unitario que sea ortogonal a las otras columnas; 
¿cuánta libertad deja esto? Compruebe que los renglones automáticamente se vuelven 
ortonormales al mismo tiempo. 


7. Demuestre, formando directamente b*b, que el teorema de Pitágoras se cumple para 
cualquier combinación b = xq, +: ** +XnQqn de vectores ortonormales: ||b|1? = 
x? + +++ +x2?,. En términos matriciales, b = Qx, de modo que esto demuestra otra vez 
que se preservan las longitudes: || Q.x 1? = [|x]1?. 


8. Proyecte el vector b = (1, 2) sobre dos vectores que no sean ortogonales, a, = (1, 0) 
y 42 = (1, 1). Demuestre que, a diferencia del caso ortogonal, la suma de las dos pro- 
yecciones unidimensionales no es igual a b. 





9. Silos vectores q, 92, 93 Son ortonormales, ¿cuál combinación de q, y q, es la más pró- 
xima a q3? 


10. Si q, y q, son la salida del proceso de Gram-Schmidt, ¿cuáles eran los posibles vecto- 
res de entrada a y b? 


A 
E 
É 
E 
E 


11, Demuestre que una matriz ortogonal triangular superior debe ser diagonal. 


12. ¿Qué múltiplo de a, = [|] debe restarse a az = [¿] para que el resultado sea ortogo- 


A E 
nal a a,? Factorice a | en OR con vectores ortonormales en O. 


A IT rr PARRA, 


13. Aplique el proceso de Gram-Schmidt a 


0 1 
a= 0|, b=|1], c=|l 
1 l 1 


y escriba el resultado en la forma A = OR. 


14. A partir de los vectores no ortogonales a, b, c, encuentre vectores ortonornales q,, 9», 


A AA O A O IO ASE SIN AMO NAO TA + 


43: 
Í l 0 
a= 1], b=y0l, c=|1 | 
0 1 1 
Jl 


15. 


16. 


e 


18. 


19. 


20. 


21. 


22. 


23, 


25. 
26. 
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Encuentre un conjunto ortonormal q,, q, 93 para el cual q, y q, generen el espacio co- 
lumna de 


1 1 
A = | 
=Z 4 


¿Qué subespacio fundamental contiene a q3? ¿Cuál es la solución por mínimos cua- 
drados de Ax=bsib=[1 2 7]? 


Exprese la ortogonalización de Gram-Schmidt de a,, a, como A = QR: 


1 1 
a = 121, a = |3¡. 
2 1 


Dados n vectores a, con m componentes, ¿cuáles son las formas de A, Q, y R? 


Con la misma matriz A del problema 16, y con b= [1 1 1)”, use A = QR para 
resolver el problema de mínimos cuadrados Ax = b. 


Si A = OR, encuentre una fórmula sencilla para la matriz proyección P sobre el espa- 
cio columna de A. 


Demuestre que los siguientes pasos modificados del proceso de Gram-Schmidt produ- 
cen la misma C que en la ecuación (10): 

C*=c=(qidn y C =C* —(4C*) qa. 
Esto es mucho más estable, restar las proyecciones una a la vez. 


En el espacio de Hilbert, encuentre la longitud del vector y = (1/ ARIAS 
V/8,... y y la longitud de la función f(x) = e* (sobre el intervalo O < x < 1). ¿Cuál es 
el producto interno sobre este intervalo de e* y e”*? 


¿Cuál es la función a cos x + b sen x más próxima a la función f(x) = sen 2x sobre 
el intervalo de 17 a 77? ¿Cuál es la recta c + dx más próxima? 


Iguale la derivada a cero para encontrar el valor de b, que minimiza 
27 
Ib, sen x — cos x]1? = (b, senx — cos x)? dx. 
0 
Compare con el coeficiente b, de Fourier. 


Encuentre los coeficientes de Fourier ay, a,, b, de la función escalón y(), que es igual 
a 1 sobre el intervalo O = x < 7r y O en el intervalo restante 71 < x < 27: 


o) eE (y, cos x) E (y, Sen x,) 
CO (cos x, cos x) ! (senx,senx) 


Encuentre los cuatro polinomios de Legendre. Se trata de una cúbica - + ax” + 
bx + c que es ortogonal a 1, x, y x”— 3 sobre el intervalo —1=x= l. 
¿Cuál es la recta más próxima a la parábola y = 1% sobre —1 <= x= 1? 


En la fórmula de Gram-Schmidt (10), compruebe que C es ortogonal a q, y 9». 


pa CEST 6 CO OPI A A 
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27. Encuentre una base ortonormal del subespacio generado por a, = (1, —1, 0, 0), a, = 
(0:1.:=1.0).43=(0.0.1,=1) 


28. Aplique el proceso de Gram-Schmidt a (1, —1, 0), (0, 1, —1) y (1, O, —1) para encon- 
trar una base ortonormal sobre el plano x, + x2 + x3 = 0. ¿Cuál es la dimensión de 


este subespacio y cuántos vectores diferentes de cero provienen del proceso de Gram- 
Schmidt? 


29. (Recomendado) Encuentre vectores ortogonales A, B y C por Gram-Schmidt a partir 
de a, b, c: 


a=(1,-1,0,0)  b=(0,1,-1,0) c=(0,0,1,—1). 


A, B, C y a, b, c son bases para los vectores perpendiculares a d = (1, 1, 1, 1). 








30. SiA = OR, entonces ATA = RR = triangular multiplicada por triangu- 
lar. El proceso de Gram-Schmidt sobre A corresponde a eliminación sobre ATA. 
Compare 

E O 
A con ATA=|-1 2 -1|. 
A NES 
O o =1 
Para ATA, los pivotes son 2, 3, 3 y los multiplicadores son —3 y —Í. 


a) Use estos multiplicadores sobre A para demostrar que la columna 1 de A y B = co- 
lumna 2 —3 (columna 1) y C = columna 3 —2 (columna 2) son ortogonales. 


b) Compruebe que [|columna 11? = 2, 1B1? = 3, y [Cl]? = $, usando los pivotes. 
Pp 2 3 


31. ¿Falso o verdadero? (proporcione un ejemplo en cualquier caso): 

a) 07? es una matriz ortogonal cuando Q es una matriz ortogonal. 

b) Si Q (de 3 por 2) tiene columnas ortonornales, entonces ||Ox]| siempre es igual a |lx]]. 
32. a) Encuentre una base para el subespacio S en R* generado por todas las soluciones de 


X1 + xa PA MA =0. 


pS 
EE 
Ly 
A 
Ss 5 
ES A 
58 
REA 
ES 
==B 
EA 
as 3 
Sy 
A 
¿ 
% 
y 
3 
5 
+ 
É 


b) Encuentre una base para el complemento ortogonal S+, 
c) Encuentre 6, en $ y b, en S* de modo que b, + ba, = b= (1, 1, 1, 1). 


ER 3.5 LA TRANSFORMADA DISCRETA DE FOURIER 


La serie de Fourier es álgebra lineal en dimensiones infinitas. Los “vectores” son funcio- 
nes f(x); éstas son proyectadas sobre los senos y los cosenos. Así se obtienen los coeficien- 
tes de Founier az y b,. A partir de esta serie infinita de senos y cosenos, multiplicados por 
Ag Y b,, es posible reconstruir a f(x). Este es el caso clásico, en el que soñaba Fourier, aun- 
que en los cálculos verdaderos lo que se calcula es la transformada discreta de Fourier 
(TDPB). Fourier sigue vivo, pero en dimensiones finitas. 

Aquí se trata de álgebra lineal pura, basada en la ortogonalidad. La entrada es una su- 
cesión de números yg, . - - » Ya 1, €n vez de una función f(x). La salida Cp, .. ., Cy, tiene 
la misma longitud n. La relación entre y y c es lineal, de modo que debe estar dada por una 
matriz. Esta es la matriz F de Fourier, y toda la tecnología del procesamiento de señales 
digitales depende de ella. La matriz de Fourier posee propiedades extraordinarias. 
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Las señales se digitalizan, ya sea que provengan del habla, de imágenes, del sonar o 
de TV (o incluso de la exploración petrolera). Las señales son transformadas por la matriz 
F, y después es posible transformarlas nuevamente con la finalidad de reconstruirlas. Lo 
crucialmente importante es que F y F”* pueden ser rápidas: 





Estas dos afirmaciones son ciertas. F”? se ha conocido durante años, y se ve justo co- 
mo F. De hecho, F es simétrica y ortogonal (excepto por un factor ./K), y sólo tiene un in- 
conveniente: sus elementos son números complejos. Este es un precio bajo que hay que 
pagar, lo cual se hace a continuación. Las dificultades son minimizadas por el hecho de que 
todos los elementos de F y F”?* son potencias de un solo número w. Este número cumple 
w"=1, 

La transformada discreta de Fourier usa w = i (y observe que 1% = 1). El éxito de to- 
da la TDF depende de la multiplicación de F por su conjugado complejo F: 


1 ES 1 1 1 1 l 

LR A O ESO ADA AD 

1 ¡2 ¿4 ¿$ 1 pao (iy (iy) =4/ (1 
19 211 oO oy Ey 

De inmediato, FF = 4/ indica que F7' = F/4. Las columnas de F son ortogonales (pa- 
ra obtener los elementos cero en 4). Las matrices de n por n cumplen FF = n/. Así, la 
inversa de F es justo F/ n. Dentro de poco se considerará el número complejo w = e?!” 
(que es igual a i¡ para n = 4). 

Es extraordinario que F' sea tan fácil de invertir. Si esto fuese todo (y hasta 1965 era 
todo), entonces la transformada discreta tendría un lugar importante. Ahora hay más. Las 
multiplicaciones por F y F”* pueden hacerse de una manera extremadamente rápida e in- 
geniosa. En vez de realizar n? multiplicaciones por separado, que provienen de los n? ele- 
mentos de la matriz, para efectuar los productos matrices-vectores Fc y F”7*y, sólo se 
requieren z n log n pasos. Este reordenamiento de la multiplicación se denomina transfor- 
mada rápida de Fourier (TRE). 

Esta sección empieza con w y sus propiedades, continúa con F”*, y termina con la 
TRE: la transformada rápida. La gran aplicación en el procesamiento de señales es la ftl- 
tración, y la clave de su éxito es la regla de convolución, En lenguaje matricial, todas las 
“matrices circulantes” son diagonalizadas por F. Así, se reducen a dos TRFs y una matriz 
diagonal. 


FF = 


Raíces complejas de la unidad 


Es posible que ecuaciones reales tengan soluciones complejas. La ecuación % + 1 =0 
condujo a la invención de í (¡y también de —¿!) Lo anterior fue declarado como una solu- 
ción y se cerró el caso. Si alguien preguntaba sobre 1% — í = O, había una respuesta: las raí- 
ces cuadradas de un número complejo de nuevo son números complejos. Es necesario 
permitir las combinaciones x + iy, con una parte real x y una parte imaginaria y, pero ya 
no se requieren inventos adicionales. Todo polinomio real o complejo de grado n tiene un 
conjunto completo de n raíces (tal vez complejas y tal vez repetidas). Este es el teorema 
fundamental del álgebra. 

Aquí se tiene interés en ecuaciones como 1% = 1. Ésta tiene cuatro soluciones: las raí- 
ces cuartas de la unidad. Las dos raíces cuadradas de la unidad son 1 y —-1. Las raíces cuar- 
tas son las raíces cuadradas de las raíces cuadradas, 1 y -1, i y —i. El número í satisface 


eee á 
O AA 
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¿* = 1 porque satisface ¡? = —1. Para calcular las raíces octavas de la unidad se requieren 
las raíces cuadradas de i, lo cual lleva a w = (1 + ¿/ Y/2. Al elevar al cuadrado w se ob- 
tiene (1 + 2i + 2/2, que es i porque 1 + 2 es cero. Así, we = ¿*= 1, Aquí debe haber un 
sistema. 

Los números complejos cos 0 + í sen O en la matriz de Fourier son extremadamente 
especiales. La parte real se traza sobre el eje x y la parte imaginaria, sobre el eje y (véase 
la figura 3.11). Así, el número w está sobre la circunferencia unitaria; su distancia al ori- 
gen es cos? 9 + sen? 9 = 1. Forma un ángulo 9 con la horizontal. Todo el plano se estudia 
en el capítulo 5, donde los números complejos aparecen como valores característicos (in- 


cluso de matrices reales). Aquí sólo se requieren puntos especiales w, todos ellos sobre la 
circunferencia unitaria, para resolver w” = 1. 





= e27/8 = cos z +¿sent 


Eje real 





Figura 3.11 Las ocho soluciones de 2 = 1 son 1,w,w?.,....w? con w = (1 +1 Y2.. 


El cuadrado de w puede encontrarse directamente (simplemente duplica el ángulo): 


w? =(cos O + ¿senO)Y = cos? 9 — sen? 9 + 2i send cos6. 


La parte real de cos? 9 — sen? 9 es cos 26, y la parte imaginaria 2 sen 9 cos 9 es sen 29. (Ob- 
serve que no se ha incluido a i; la parte imaginaria es un número real). Por tanto, w? = cos 
20 + i sen 26. El cuadrado de w sigue estando en la circunferencia unitaria, pero al ángulo 
doble 20. Esto hace sospechar que w” está en el ángulo n0, y la sospecha es correcta. 

Hay una mejor manera de tomar potencias de w. La combinación del coseno y el se- 
no es una exponencial compleja, con amplitud 1 y ángulo de fase 6: 


Ne 
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(2) 





Las reglas para multiplicar, como (ee?) = e?, se siguen cumpliendo cuando los exponen- 
tes ¿O son imaginarios. Las potencias de w = e* permanecen en la circunferencia unita- 


-. 


rule: 


Potencias de w 


(3) 





La n-ésima potencia está al ángulo n6. Cuando n = —1, el ángulo del recíproco 1/w es 9. 
Si cos O + í sen O se multiplica por cos(—8) + i sení—0), se obtiene la respuesta 1: 


a a a 1 A LA AAA NA AN CMA + 


e'927i9 = (cosó + ¿senG9NKcosÓ — ¡sen 0) =cos* O + sen? = 1. 


Sl” 
A A 
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Nota Recuerdo el día en que al MIT llegó una carta enviada por un prisionero en Nueva 
York, preguntando sí la fórmula de Euler (2) era cierta. Es verdaderamente sorprendente 
que tres de las funciones clave en matemáticas se presenten juntas de forma tan elegante. 
Nuestra mejor respuesta fue considerar la serie de potencias de la exponencial: 
¡9 (10) 

(0)” , (0) 

2! ds 
La parte real 1 — 9/2 + - - - escos 6. La parte imaginaria 9 — 93/6 +... es el seno. La 
fórmula es correcta, y me hubiera gustado enviar una demostración más hermosa. 


e? =1 +10 + FETO 








Con esta fórmula es posible resolver w” = 1. Esto se convierte en e'"? = 1, de modo 
que n0 debe llevarnos alrededor de la circunferencia unitaria y volver al principio. La so- 
lución es escoger 9 = 2x1/n: la n-ésima raíz “primitiva” de la unidad es 





(4) 


Pe 


Su n-ésima potencia es e”"', que es igual a 1. Para n = 8, esta raíz es (1 +1)/V2: 


O Ti . os Tr l+i 
a died y 108 C0S 7 TASAS 


4. y2 


La raíz cuarta está en 9 = 90%, que es 3 (3607). Las otras raíces cuartas son las potencias 
2 =-—1,1% = —i,e ¡*= 1. Las otras raíces octavas son las potencias w¿, wi, ..., wx. Las 
raíces son equidistantes sobre la circunferencia unitaria, a intervalos de 277/n. Observe nue- 
vamente que el cuadrado de wz es wa, lo cual es esencial en la transformada de Fourier rá- 
pida. La suma de las raíces es cero. Primero 1 + ¿-1-i=0, y luego 


Suma de las raíces octavas 1 + w3 +w +++: +w] =0, (5) 


Una demostración es multiplicar el miembro izquierdo por wz, que lo deja sin cambio. (Se 
obtiene wz + wi +-+** + wi, y wi, es igual a 1). Cada uno de los ocho puntos se des- 
plaza un ángulo de 459, aunque siguen siendo los mismos ocho puntos. Debido a que cuan- 
do se multiplica por wz el único número que permanece sin cambio es el cero, la suma debe 
ser cero. Cuando n es par, las raíces se cancelan por pares (como l + i2=0Dei+i? =0). 
Sin embargo, la suma de las tres raíces cúbicas de 1 también es igual a cero. 


La matriz de Fourier y su inversa 


En el caso continuo, la serie de Fourier puede reproducir a f(x) sobre todo un intervalo. Ut1- 
liza una infinidad de senos y cosenos (o exponenciales). En el caso discreto, con sólo n coe- 
ficientes Co,...» Cn-1 a elegir, sólo se pide igualdad en n puntos. Así se obtienen n 
ecuaciones. Se reproducen los cuatro valores y = 2, 4, 6, 8 cuando Fc = y: 
Co Cr A E la 22 
Cor AC $ ¿2c, y Pe, 4 
Co 56 ?e, a “co es ¿cy = 6 
Co + ¿Be + ic + 1% = 8. 
La secuencia de entrada es y = 2, 4, 6, 8. La secuencia de salida es Co, C1, C2, C3. Las cua- 


tro ecuaciones (6) buscan una serie de Fourier de cuatro términos que corresponda a las en- 
tradas en cuatro puntos equidistantes x sobre el intervalo de O a 27r: 


tl 


Fe = y (6) 


ENT 
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2 en x=0 
Serie de E 
, Sl ix Zix LR 4 cn x= 7E/ 2 
Fourier CORECIE” TOO e 6 
>. e prrerar= 
discreta ES 
8 en x =3x/2 


Éstas son las cuatro ecuaciones en el sistema (6). En x = 2, la serie devuelve yo = 2 y 
continúa periódicamente. La serie de Fourier discreta se escribe mejor en su forma comple- 
ja, como una combinación de exponenciales e'*, en vez de como sen kx y cos kx. 

Para toda n, la matriz que relaciona y con c puede invertirse. Representa n ecuaciones, 
lo cual requiere que la serie finita cy + c¡e'* + -.. (n términos) coincida con y (en n pun- 
tos). La primera coincidencia es en x = O, donde cy + *** + Cr-1 = Yo. Los puntos res- 
tantes conllevan potencias de w, y el problema completo es Fc = y: 





1 1 1 : 1 Co Y0 

low Ue e c y1 

E TA E ii ti]. 0 
e a A O E Ya-1 


Ahí queda la matriz F de Fourier con elementos F¡¿ = w**. Resulta natural numerar los 
renglones y las columnas desde O hasta n — 1, en vez de hacerlo desde 1 hasta n. El primer 
renglón tiene j = 0, la primera columna tiene k = 0, y todos los elementos son w* = 1. 

Para encontrar las cs es necesario invertir F. En el caso de 4 por 4, F”? se construyó 
a partir de 1/1 = —(i. Esta es la regla general, que F”* proviene del número complejo 
w”! = 77. Está en el ángulo —27/n, donde w estaba en el ángulo +2 77m. 


di ES casa A O A O ts e II RE TS EN en 
So > E e A CAES A ARIAS ESE: TE RAE AO 

NU NS De Y Mi A ID Sa e pon MS IAE va 

il O eN » x Ny E EN A E E RIE el 






inversa se construye a partir de las pote 





8 
1] 
: 
É 


AIR LAA. 


1 1 1 1 1 1 1 
Así F=i1 ¿gn 13 gtri13 tiene pe == |1 e? 3 e 2m13 
1 etmi3 ¿mia 3 1 gróril3  ¿—8mi3 


O nd 


La multiplicación del renglón j de F por la columna j de F”* siempre es (1+1+- + 
D)/n = 1. La parte más difícil es fuera de la diagonal, demostrar que el renglón ¡ de F mul- 
tiplicado por la columna k de F”? es cero: 


- ARI lA RCN 11 ep retar 


1 +otw rt AR y My DES O si JÁ (9) 


La clave es observar que estos términos son las potencias de W = w'w”*: 





(10) 


IAE III paran Leen mios Zamba 


El número W sigue siendo una raíz de la unidad. W* = yw” y”"* es igual a Y17*= 1. Ya 


que j es distinto de k, W es diferente de 1. Es una de las otras raíces sobre la circunferen- 
cla unitaria. 


a A rd en ga 


a A 


E y hr E E CA a de REAL IA 
A E A yn 
me AS Sn DA e oz 
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Estas raíces satisfacen. 1+ Wo hz e «feb. Wero. 0, Otra demostración proviene de 
1 W” =(1- WU +W>+W?+-.-+w") (1D 


Debido a que W” = 1, el miembro izquierdo es cero. Pero W no es 1, por lo que el último 
factor debe ser cero. Las columnas de F son ortogonales. 


La transformada rápida de Fourier (TRF) 


El análisis de Fourier constituye una hermosa teoría, además de ser bastante práctico. Ana- 
lizar una forma de onda en sus frecuencias es la mejor manera de aislar una señal. El pro- 
ceso inverso regresa la señal. Por razones físicas y e lieoiaE: las exponenciales son 
especiales, y es posible precisar una razón central: Si e** se anne aoia se integra, o six 
se traslada a x + h, el resultado sigue siendo un múltiplo de e. Las exponenciales se 
ajustan especialmente a ecuaciones diferenciales, a ecuaciones integrales, y a ecuaciones 
en diferencias. Cada componente de la frecuencia va a su manera, como vector caracterís- 
tico, y se recombinan en la solución. El análisis y la síntesis de señales —calculando c a par- 
tir de y y y a partir de c— constituyen una parte toral del cálculo científico. 

Se quiere demostrar que Fc y F7*y pueden efectuarse rápidamente. La clave está en 
la relación de F¿ con F,, O mejor aún, con dos copias de F,, que van en la matriz Ff: 


1 l 1 1 


F4 = : 
, ¿ 


1 
2 
4 
¡ 6 


un nn e. 


3 
.6| está próximo a FEF, = 1 1): 
¿9 


A 


l 
¿ 
l 


F4 contiene las potencias de wa = i, la raíz cuarta de 1. F7 contiene las potencias de wa = 
—1, la raíz cuadrada de 1. Observe especialmente que la mitad de los elementos en F3'. La 
transformada de 2 por 2, aplicada dos veces, sólo requiere la mitad de trabajo que una trans- 
formada directa de 4 por 4. Si una transformada de 64 por 64 puede sustituirse por dos 
transformadas de 32 por 32, entonces el trabajo se reduce a la mitad (más el costo de vol- 
ver a ensamblar los resultados). Lo que hace realidad, y posible en la práctica, lo anterior, 
es la simple relación entre Wga Y W32: 


2xi/64,2  g2mt!32 


A = Wo, obien (le 


La trigésimosegunda raíz está dos veces más lejos en la circunferencia unitaria que la se- 
xagésimacuarta raíz. Si w% = 1, entonces (w?)?? = 1. La m-ésima raíz es el cuadrado de 
la n-ésima raíz, si m es la mitad de n: 


(12) 





La rapidez de la TRF, en la forma estándar aquí presentada, depende de trabajar con 
números altamente compuestos como 2*? = 1024. Sin la transformada rápida, se requie- 
ren (1024) multiplicaciones para obtener F por c (lo cual se desea a menudo). En contras- 
te, una transformada rápida puede realizar cada multiplicación en sólo 5 - 1024 pasos. Es 
200 veces más púpteio ya que sustituye un factor de 1024 por 5. En general, sustituye n? 
multiplicaciones por 3 2Ln£, cuando n es 2*. Al relacionar F,, con dos on de Fu, y luego 
con cuatro sonia de F n/a, Y finalmente con una F muy pequeña, los 1” pasos de costumbre 
se reducen a 1 3 1 logan. 


Es necesario ver cómo y = F,c (un vector con n componentes) puede recuperarse a 
partir de dos vectores que sólo miden la mitad de largo. El primer paso es dividir c entre 
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sí mismo, separando sus componentes con número par de sus componentes con número 
impar: 
Ps MAS 
= (C0, 02)...» Cn-2) y Cc” = (01, C3,..., Ca-1). 


Los coeficientes simplemente van de forma alterna en c” y c”. A partir de estos vectores, la 
transformada a la mitad de tamaño proporciona y' = F,,c* y y” = F,,c”. Estas son las dos 
multiplicaciones por la matriz más pequeña F,,,. El problema central consiste en recuperar 
y a partir de los vectores y” y y” que miden la mitad, Cooley y Tukey se dieron cuenta de 
cómo hacerlo: 


UY Alli E ia e A Si E Era Fa RS 
QS 


3W ¿Las m. ” primeras y y. las m últimas : componentes de vector. y 


AS 
ved rad 











y) = y, + ly", 3 A] 


: Ao, j= 
y Yjim = Y] Y» e RE 
ono A, RE: unes ÉS xe ¿Me ALAS 


Por tanto, los, tes pasos s son: Separar « cen El Y Cr Es 


Ae 





20 NS 








En un momento se comprobará que haciendo lo anterior se obtiene la y correcta. (Qui- 
zá el lector prefiera un diagrama de Flujo al álgebra). Esta idea puede repetirse. Se va de 
Fi 074 4 Fs12 € Fa56 La cuenta final es ¿n£, cuando se empieza con la potencia n = 2f y 
todo el camino la dirección es hacia n = 1, donde no se requiere multiplicación. Este nú- 


mero nl, satisface la regla antes proporcionada: el doble del conteo para m, más m mul- 
E ULAcionaS extra, producen el conteo para n: 


1 
% (¿ne == 1) +m= ¿ne 


Otra forma de contar: De n = 2% an = 1 hay £ pasos. Cada paso requiere n/2 multiplica- 
ciones por D,,y2 en la ecuación (13), que en realidad es una factorización de F,,: 





| 
| 





El costo es sólo ligeramente más que lineal. El análisis de Fourier ha sido transforma- 
do completamente por la TFR, Para comprobar la ecuación (13), es necesario separar y, en 
par e impar: 


n-"1 m--1 mel 
y, = Y wife  esidéntica a O e 
k=0 k=0 k=0 


a A la A 


Cada sumatoria de la derecha consta de m = 5 n términos. Debido a que w? es W,,, las dos 
sumatorias son: 


Tuta + w Nu oo ES why; (15) 


Para la segunda parte de la ecuación (13), j + m en vez de j produce un cambio de signo: 
Dentro de las sumatorias, w£4*") permanece w“Y debido a que wi” = 1% = 1, 
Fuera w/*" = —w] ya que w” = g?tim/n = gri = —], 


La idea de la TRE se modifica fácilmente con la finalidad de permitir otros factores primos 


de n (no sólo potencias de 2). Si n mismo es primo, se aplica un algoritmo completamente 
distinto. 


DATA eg SS pl . tor, 
o y . pd de e 
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Ejemplo 1 
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Los pasos de n = 4am= 2 son 


Fac 
C1 22 
A — A —> A Y 
A 1 
Fc” 
C3 C3 


Combinados, los tres pasos multiplican c por F, para obtener y. Debido a que cada paso es 
lineal, debe provenir de una matriz, y el producto de estas matrices debe ser F'4: 


1 a A 1 1 A 1 
¡A E a 1 ¿ll d1 —1 1 
e e a A —1 1 1 1 

o 1 5 1 -1 : 


(16) 


Las dos copias de F, se reconocen en el centro, A la derecha se encuentra la matriz permu- 
tación que separa cen c” y c”. A la izquierda está la matriz que multiplica por wy. Si se hu- 
biera empezado con Fg, la matriz de en medio hubiera contenido dos copias de F¿. Cada 
una de éstas se hubiera separado como se hizo arriba. Entonces, ¡la TRF representa una 
factorización gigante de la matriz de Fourier! La simple matriz con n? no ceros es un pro- 
ducto de aproximadamente £ = log, n matrices (y una permutación) con un total de sólo 
né no ceros. 


La TRF y la mariposa 


El primer paso de la TRF cambia la multiplicación por F, en dos multiplicaciones por Fy. 
Las componentes con número par (c,, c,) se transforman por separado de (c,, cz). En la fi- 
gura 3,12 se proporciona un diagrama de flujo para n = 4, 


00 > Y 00 
E 

10 Y; 01 

01 Ya 10 
e” 

11 Ya 11 





Figura 3.12 Diagrama de flujo para la transformada de Fourier rápida con n = 4. 


Para n = 8, la idea clave es sustituir cada recuadro F, por recuadros F). El nuevo factor 
Wa = ¡es el cuadrado del factor anterior w = wa = e2"8. El diagrama de flujo muestra 
el orden en que las cs entran en la TRE y las log, n etapas que les lleva entrar, y también 
muestra la sencillez de la lógica. 


196 


pa 
y 


Capítulo 3 Ortogonalidad 


Cada etapa requiere 3n multiplicaciones, de modo que el conteo final es n log n. Hay 


una regla asombrosa para la permutación global de cs antes de entrar en la TRF: Escribir 


los subíndices O, ..., 7 en binario e invertir el orden de sus bits. Los subíndices aparecen 
en “orden invertido de bits” en la parte izquierda de la gráfica. Los números pares apare- 


cen antes que los impares (los números que terminan con O aparecen primero que los nú- 
meros que terminan con 1). 


Conjunto de problemas 3.5 


1. 
2. 


10. 


11. 


12. 


13, 


14, 


¿Qué son F? y F* para la matriz F' de Fourier de 4 por 4? 


Encuentre una permutación P de las columnas de F que produzca FP = F' (de n por 


n). Combine lo anterior con FF = n] con la finalidad de encontrar F? y F* para la 
matriz F de Fourier de n por n. 


Si se forma una submatriz de 3 por 3 de la matriz F¿ de 6 por 6, manteniendo sólo los 
elementos que están en sus renglones y columnas, primero(a), tercero(a) y cuarto(a), 
¿cuál es esa submatriz? 


Indique todas las raíces sextas de 1 en el plano complejo. ¿Cuál es la raíz primitiva 
we? (Encuentre sus partes real e imaginaria). ¿Qué potencia de wg es igual a 1/w5? 
¿Cuáles | +0 +u% +10 +w0% + 1057 


Encuentre todas las soluciones de la ecuación e'* = —1, y todas las soluciones de 
y 

e? =1. 

¿Cuáles son el cuadrado y la raíz cuadrada de w:;»g, la centésimovigesimaoctava raíz 

primitiva de 1? 


Resuelva el sistema (6) de 4 por 4 si los miembros derechos Son yy = 2, y, = 0, y, = 
2, y3 = 0. En otras palabras, resuelva Fyc = y. 


Resuelva el mismo sistema con y = (2, O, —2, 0) sabiendo que EJ” y calculando 
c = F¿*. Compruebe que Co +c¡e'* +07€%* + c3e%* asume los valores 2, 0, —2, 0 
en los puntos x = 0, 13/2, 73, 37012. 


a) Si y = (1, 1, 1, 1), demuestre que c = (1, 0, O, 0) satisface Fyc = y. 
b) Ahora suponga que y = (1, 0, O, 0), y encuentre c. 


Para n = 2, escriba yy a partir de la primera línea de la ecuación (13) y y, a partir de la 
segunda línea. Para n = 4, use la primera línea para encontrar yo y y, y la segunda 
línea para encontrar y, y y3, todo en términos de y” y y”. 


Calcule y = F¿c mediante los tres pasos de la transformada rápida de Fourier si c = 
(1, O, 1, 0). Repita el cálculo con c = (0,1,0,1,0,1,0,1). 


Calcule y = Fgc mediante los tres pasos de la transformada rápida de Fourier si c = 
(1,0, 10,-L,:0; 0). Repita el cálculo. con e =0, 1,0.1,0.L.0, 1D). 


Para la matriz de 4 por 4, escriba las fórmulas para Cy, Ci, C2, C3 y compruebe que si f 
es impar, entonces c es impar. El vector fes impar si f,_., = —f5 para n = 4 esto sig- 
nifica fo = 0, = ff = O como en sen O, sen 7r/2, sen 7r, sen 37r/2. Esto es co- 
piado por c y conduce a una transformación rápida del seno. 


Multiplique las tres matrices en la ecuación (16) y compare con F. ¿En cuáles seis ele- 


mentos es necesario saber que ¿? = —1? 
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15. Invierta los tres factores en la ecuación (14) para encontrar una factorización rápida de 
pa 


16. Fes simétrica. Así, ¡trasponga la ecuación (14) para encontrar una nueva transforma- 
da rápida de Founer! 


17. Todos los elementos en la factorización de F'¿ implican potencias de w = raíz sexta de 1: 


2-2 1] 


Escriba estos factores con 1, w, w*en D y 1, w?, w* en F,. ¡Multiplique! 


En los problemas 18 a 20 se introducen los conceptos de vector característico y valor 
característico, cuando el producto de una matriz multiplicada por un vector es un 
múltiplo de ese vector. Este es el tema del capítulo 5. 


18. Las colunmas de la matriz de Fourier F' son los valores característicos de la permuta- 


ción cíclica P. Multiplique PF para encontrar los valores característicos Ay a Az: 


Or MOORE ML 1 E AS E E 
A o 3 0 ls UE E 1 3 
E E E E O y O la 
O A O TE A UE UR 1 E 


> i Az 


Éstaes PF=FA,oP =FAF"!. 


19. Dos vectores característicos de esta matriz circulante c son (1, 1, 1, 1) y (1,7, 12, 13). 
¿Cuáles son los valores característicos ey y e,? 
to dí Cas ES 1 1 1 1 
C3 Co Cj Ca LE 1 3 O i 
= €9 y Cloil=eéel. 
C2 (3 Co Ci 1 1 j L 
Ci Ca C3 Co 1 1 13 ¡3 


20. 


21. 


22. 


Encuentre los valores característicos de la matriz “periódica” C -1, 2, —1. Los 1s en 
las esquinas de C la hacen periódica (una matriz circulante): 


O A 


e o IE $ JO 
CS 0-1 2 -1| Une co = 2.61 ==1, 020, c >= 
e UA AZ 


Para multiplicar C por x, cuando C = FEF”?, es posible multiplicar F(E(F7 Lo). En 
el producto directo Cx se requieren n* multiplicaciones por separado. Si se conocen E 
y F, con el segundo método sólo se usan n log, n + n multiplicaciones. ¿Cuántas de 
éstas provienen de F, y cuántas de F7?? 


¿Cómo podría calcular rápidamente estas cuatro componentes de Fc empezando con 
Co “+ Ca, Co — C2, 01 + 03,01 — C3? ¡Está encontrando la transformada rápida de Fou- 
rier! 


CO ASAO 

co Fic; + i2ca +3 

Co + ic, + 5% +i%03 
alo Pc, Eo iéca + ¿03 
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3.4 
3-3 
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3.9 
3.10 


3.11 
3,12 


3.13 


3.14 


IAS 


3.16 


3.17 


3.18 


Ejercicios de repaso 


Encuentre la longitud de a = (2, —2, 1), y escriba dos vectores independientes que 
sean perpendiculares a e. 


Encuentre todos los vectores que sean perpendiculares a (1, 3, 1) y (2, 7, 2), hacien- 
do a éstos los renglones de A y resolviendo Ax = O. 


¿Cuál es el ángulo entre a = (2, —2, 1) y b = (1, 2, 2)? 
¿Cuál es la proyección p de b = (1, 2, 2) sobre a = (2, —2, 1)? 
Encuentre el coseno del ángulo entre los vectores (3, 4) y (4, 3). 


¿Dónde está la proyección de b = (1, 1, 1) sobre el plano generado por (1, 0, 0) y 
Ci cO)a 


El sistema Ax = b tiene una solución si y sólo si b es ortogonal a ¿cuál de los cuatro 
subespacios fundamentales? 


¿Qué recta proporciona el mejor ajuste a los datos siguientes: b =0en1=0,5b=0 
ent=1,b= lMen1t= 3? 


Construya la matriz proyección P sobre el espacio generado por (1, 1, 1) y (0, 1, 3). 


¿Cuál función constante está más próxima de y = x* (en el sentido de mínimos cua- 
drados) sobre el intervalo 0 = x = 1? 


Si O es ortogonal, ¿es cierto lo mismo para Q*? 


Encuentre todas las matrices ortogonales de 3 por 3 cuyos elementos sean ceros y 
unos. 


¿Qué múltiplo de a, debe restarse a a,, para que el resultado sea ortogonal a a,? Di- 
buje una figura. 


Factorice 


cosó senó 
senó 0 


como OR, reconociendo que la primera columna ya es un vector unitario. 


Si todo elemento de una matriz ortogonal es : O =¿ , ¿Cuál es el tamaño de esta ma- 
triz? 
Suponga que los vectores q;,. . - , q, son ortonormales. Si b = C1q1 + *** +C1Gn, 


proporcione una fórmula para calcular el primer coeficiente c, en términos de b y las 
gs. 


¿Qué palabras describen a la ecuación ATAX = ATD, al vector p = AX = Pb, ya 
la matriz P = A(ATAJ AT? 


Si los vectores ortonormales 91 = (3, %,—3) y q2 = (—3, 5, 3) son las colum- 
nas de O, ¿cuáles son las matrices Q”O y 00”? Demuestre que 00” es una matriz 
proyección (sobre el plano de q; y q»). 
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Si v;,...,v, es una base ortonormal de R”, demuestre que v,v] +++*+* +u,ur = 


¿Falso o verdadero? Sí los vectores x y y son ortogonales, y P es una proyección, en- 
tonces Px y Py son ortogonales. 


Intente ajustar una recta b = C + Dt que pasa por los puntos b = 0,t= 2, y b= 6, 
1 = 2, y demuestre que las ecuaciones normales fracasan. Dibuje todas las rectas óp- 
timas, minimizando la suma de los cuadrados de los dos errores. 


¿Cuál punto en el plano x + y—z = O es el más próximo a b = (2, 1, 0)? 
Encuentre una base ortonormal de R*, empezando con el vector (1, 1, —1). 


Rastreadores CT examinan a un paciente desde direcciones distintas y producen una 
matriz que proporciona las densidades del hueso y el tejido en cada punto. Matemá- 
ticamente, el problema consiste en recuperar una matriz a partir de sus proyecciones, 
En el caso de 2 por 2, ¿es posible recuperar la matriz A si se conoce la suma a lo lar- 
go de cada renglón y de cada columna? 


¿Es posible recuperar una matriz de 3 por 3 si se conocen las sumas en los renglones, 
las sumas en las columnas y también la suma a lo largo de la diagonal principal, así 
como a lo largo de las otras cuatro diagonales paralelas? 


Encuentre una base ortonormal del plano x — y + z = O, y encuentre la matriz P que 
proyecte sobre el plano. ¿Cuál es el espacio nulo de P? 


Sea A = [3 1 — 1], y sea V el espacio nulo de A. 

a) Encuentre una base para Y y una base para V?. 

b) Escriba una base ortonormal para V*, y encuentre la matriz proyección P, que 
proyecta vectores de R? sobre V-. 

c) Encuentre la matriz proyección P, que proyecta vectores de R?* sobre V. 


Aplique el proceso de Gram-Schmidt para construir un par ortonormal q,, q, a partir 
de a, = (4, 5,2, 2) y a, = (1, 2, O, 0). Exprese a, y 47 como una combinación de q; 
y 9, y encuentre la matriz triangular R en la forma A = OR. 


Para A, b, x, y y cualesquiera, demuestre que 

a) S1Ax = by y'A =0, entonces y*b = O. 

b) Si Ax = 0 y A%y = bd, entonces xp = 0. 

¿Cuál teorema demuestra esto sobre los subespacios fundamentales? 


¿Existe alguna matriz cuyo espacio renglón contenga a (1, 1, 0) y cuyo espacio nulo 
contenga a (0, 1, 1)? 


La distancia de un plano ax = c (enel espacio m-dimensional) al origen es |cl/llall. 
¿Cuán lejos está el plano del origen x, + x2— Xx3 — X4 = 8, y cuál punto en éste es el 
más próximo? 


En el paralelogramo con vértices en O, v, w, y v + w, demuestre que la suma de las 
longitudes al cuadrado de los cuatro lados es igual a la suma de las longitudes al cua- 
drado de las dos diagonales. 


E IN a Dimar a = 
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3.33 a) Encuentre una base ortonormal para el espacio columna de A. 


1.56 
3 6 
A=|4 Sh 
3 0 
7 8 


b) Escriba A como OR, donde Q tiene columnas ortonormales y R es triangular su- 
perior. 
c) Encuentre la solución por mínimos cuadrados de Ax = b, sib = (—3,7, 1,0, 4). 


3.34 Con la matriz de ponderación W = É yl ¿Cuál es al producto interno de (1, 0) con 
(0,12 


3.35 Para resolver un sistema rectangular Ax = b, reemplazamos A”* (que no existe) se 
sustituye por (A14)714* (que existe si las columnas de A son independientes). De- 
muestre que ésta es una inversa izquierda de A pero no una inversa derecha. A la iz- 
quierda de A proporciona la identidad; a la derecha proporciona la proyección P. 


3.36 Encuentre la recta C + Dt que ajuste mejor las mediciones b = O, 1, 2, 5 en los ins- 
tantes £ = 0, 1,3, 4. 


3.37 Encuentre la curva y = C + D2' que proporcione el mejor ajuste por mínimos cua- 
drados a las mediciones y = 6ent=0,y=4ent= 1,y y = Oen: = 2. Escriba las 
tres ecuaciones que se resuelven si la curva pasa por los tres puntos, y encuentre los 
mejores C y D. 





3.38 Si las columnas de A son ortogonales entre sí, ¿qué puede decir sobre la forma de 
ATA? Si las columnas son ortonormales, ¿qué puede decir entonces? 


3.39 ¿Qué condición deben cumplir las columnas de A (que puede ser rectangular) para 
que ATA sea invertible? 


A a a a OS RA cdo: 


, e Y 
HA rIMPAMO AD A NI DUCABDA e ICAC A LAO Vga HUIR OA O MANCO 2 


Capítulo 

















4.1 INTRODUCCIÓN 


Los determinantes están mucho más lejos del centro del álgebra lineal de lo que estaban 
hace cien años. ¡Las matemáticas siguen cambiando de dirección! Después de todo, un 
simple número puede decir tanto sobre una matriz. De todos modos, es extraordinario 
cuánto puede hacer este número. 

Un punto de vista es: el determinante constituye una fórmula “explícita” para cada ele- 
mento de 47? y A7*b, Esta fórmula no modifica la manera de realizar los cálculos; inclu- 
so el determinante en sí se encuentra por eliminación. De hecho, la eliminación puede 
considerarse como la manera más eficiente de sustituir los elementos de una matriz, de n 
por n en la fórmula. Lo que hace la fórmula es mostrar cómo A”* depende de los n*? ele- 
mentos de A, y la forma en que varía cuando los elementos cambian. 

Los usos más importantes de los determinantes pueden enumerarse como se muestra 
a continuación: 


1. Prueban la invertibilidad. Si el determinante de A es cero, entones A es singular, Si 
detA + 0, entonces A es invertible (y A7* implica 1/det A). 

La aplicación más importante, y la razón por la que este capítulo es esencial para el li- 
bro, es en la familia de matrices A — A. El parámetro A se resta a lo largo de toda la dia- 
gonal principal, y el problema consiste en encontrar los valores característicos para los 
cuales A — Af es singular. La prueba es det(A — 41) = O. Este polinomio de grado nena 
tiene exactamente n raíces. La matriz tiene n valores característicos. Este hecho se conclu- 
ye por la fórmula del determinante, y no por computadora. 


2. El determinante de A es igual al volumen de una caja en el espacio n-dimensional. Las 
aristas de la caja provienen de los renglones de A (véase la figura 4.1). Con las columnas 
de A se obtiene una caja totalmente diferente con el mismo volumen. 

La caja más sencilla es un cubo pequeño dV = dx dy dz, como en J/J f(x, y. 7 dV. 
Suponga que se cambia a coordenadas cilíndricas mediante x = r cos 0, y = r sen 6, y 
z = z. También que el pequeño intervalo dx se alarga a (dx/duldu —cuando u sustituye a x 
en una simple integral — así el elemento de volumen se convierte en J dr d0 dz. El determi- 
nante jacobiano es el análogo tridimensional del factor de alargamiento dx/du: 


90x/0r 09x/008 3x/09z cosg9 —rsen9 0 
Jacobiano J=|0y/0r 09y/96 09y/0z|=|seno rcosó Ol. 
0z/0r 02/00 092/02 0 0 1 


El valor de este determinante es J = r. Es la r en el elemento de volumen cilíndrico r dr 
d8 dz; este elemento es nuestra pequeña caja. (Al intentar dibujarla se ve curva, aunque qui- 
zá se haga más recta a medida que las aristas se vuelven infinitesimales.) 
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(031, 0.32; 033) 










(411, Q12, 013) (a91, 0422, 423) 


TL 


Figura 4.1 Caja formada a partir de los renglones de A: volumen = Ideterminante!. 


3. El determinante proporciona una fórmula para cada pivote. Teóricamente, es posible 
pronosticar cuándo un elemento pivote es cero, lo cual requiere un intercambio de renglo- 
nes. A partir de la fórmula determinante = =+ (producto de los pivotes), se concluye que 
sin importar el orden de la eliminación, el producto de los pivotes permanece igual, salvo 
el signo. 

Hace años, este hecho condujo a la creencia de que era inútil escapar a un pivote 
pequeño intercambiando renglones, ya que al final el pivote pequeño ganaría la partida. 
Sin embargo, lo que suele ocurrir en la práctica, en caso de que no sea posible evitar un 
pivote anormalmente pequeño, es que en muy poco tiempo se presenta un pivote anormal- 
mente grande. Así es como el producto se vuelve nuevamente normal, aunque deja en rui- 
nas la solución numérica. 


4. El determinante mide la dependencia de A” *b respecto a cada elemento de b. Si en un 
experimento se cambia un parámetro, o una observación es corregida, el “coeficiente con- 
taminante” en A”* es un cociente de determinantes. 

Hay otro problema respecto al determinante. Es difícil no sólo decidir acerca de su im- 
portancia, así como de su lugar idóneo en el álgebra lineal, sino también elegir la mejor de- 
finición. Resulta evidente que, det A no es alguna función extremadamente sencilla de n* 
variables; en caso contrario, sería mucho más fácil encontrar A”* de lo que realmente es. 


Las cuestiones sencillas sobre el determinante no son las fórmulas explícitas, sino 
las propiedades que posee. Esto sugiere un lugar natural para comenzar. El determinante 
puede (como será el caso) definirse mediante sus tres propiedades más importantes: det 
T = 1, el signo se invierte por un intercambio de renglones, el determinante es lineal 
en cada renglón por separado. Entonces el problema es demostrar cómo, usando estas 
propiedades de manera sistemática, es posible calcular el determinante. Esta situación re- 
trotrae al producto de los pivotes. 

En la sección 4.2 se explicarán estas tres propiedades definitorias del determinante, así 
como sus consecuencias más importantes. En la sección 4.3 se proporcionarán dos fórmulas 
más para calcular el determinante: la “gran fórmula” con n! términos y una fórmula por “in- 
ducción”. En la sección 4.4, el determinante se aplica para encontrar A7*. Luego, x = A7!b 
se calcula con la regla de Cramer. Y finalmente, en una observación opcional sobre permu- 
taciones, se demuestra que sin importar el orden en que se apliquen las propiedades, el resul- 
tado siempre es el mismo; es decir, las propiedades definitorias son autoconsistentes. 
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Esta es una pregunta optimista sobre las permutaciones: ¿cuántos cambios son nece- 
sarios para cambiar VISA en AVIS? Esta permutación, ¿es par o impar? 





4.2 PROPIEDADES DEL DETERMINANTE 


Consisten en una lista bastante larga. Por fortuna, cada regla es fácil de encontrar, e inclu- 
so más fácil de Hustrar, mediante un ejemplo de 2 por 2. En consecuencia, se comprobará 
que la conocida definición en el caso de 2 por 2, 

a b 


a b 
Le E d | Ad 
posee cada propiedad de la lista. (Observe las dos notaciones aceptadas para el determinan- 
te, det A y 141.) Las propiedades de 4 a 10 se deducen de las propiedades previas. Cada 


propiedad es una consecuencia de las tres primeras. Se recalca que las reglas son váli- 
das para matrices cuadradas de cualquier tamaño. 


= ad — be, 








1. El determinante de la matriz identidad es 1. 





0 00 
det] = 1 E 1 =] y > 1:07 oa 
SN 
2. El determinante cambia de signo cuando se intercambian dos renglones. 
Intercambio de renglones c q =cb=ad = - a b A 
as b Ea 














El determinante de cualquier matriz permutación es det P = 11. Mediante intercambio de 
renglones es posible transformar P en la matriz identidad. Cada intercambio de renglones 
cambia el signo del determinante, hasta que se llega a det 7 = 1. ¡De ahí se obtienen todas 
las demás matrices! 


3. El determinante depende linealmente del primer renglón. Suponga que A, B, C son 
iguales a partir del segundo renglón, y que el renglón 1 de A es una combinación lineal de 
los primeros renglones de B y C. Entonces la regla establece: det A es la misma combina- 
ción que det B y det C. 

Las combinaciones lineales implican dos operaciones: sumar vectores y multiplicar 
por escalares. Por consiguiente, esta regla puede separarse en dos partes: 











e asa bebo las 0 E 
Sumar los vectores en el renglón 1 É d | a A + eS 
eE 2 a ED a A 
Multiplicar por f en el renglón 1 A, a AU | ; 











Observe que la primera parte no es la afirmación falsa det(B + C) = det B + det C. No es 
posible sumar todos los renglones: sólo se permite cambiar a un renglón. Ambos miembros 
proporcionan la respuesta ad + ad — bc — b'c. 

La segunda parte no es la afirmación falsa det(1A) = £ det A. La matriz A tiene un fac- 
tor £ en cada renglón (y el determinante se multiplica por t”). Es como el volumen de una 
caja, cuando todos los lados se alargan por 4. En n dimensiones, el volumen y el determi- 
nante se alargan por 4”. Si sólo se alarga un lado, el volumen y el determinante se alargan 
por 4; ésta es la regla 3. Por la regla 2, no hay nada especial respecto al renglón 1. 
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Ahora ya se ha establecido el determinante, aunque este hecho no es nada evidente. 
En consecuencia, las reglas se aplican gradualmente para encontrar el determinante de 
cualquier matriz. 


4. Sidos renglones de A son iguales, entonces det A = 0. 


b 
Renglones iguales S b | = ab — ba =0. 





Esto se concluye de la regla 2, ya que si se intercambian los renglones iguales, se supone 
que el determinante cambia de signo. Pero también queda igual, porque la matriz no carm- 
bia. El único número capaz de hacer esto es el cero, de modo que det A = 0. (El razona- 
miento falla si 1 = —1, que es el caso en álgebra booleana. Así, la regla 4 sustituye a la 
regla 2 como una de las propiedades definitorias). 


5. Restar un múltiplo de un renglón de otro renglón deja igual al determinante. 


a=tc bed a b 
d ea 


Operación en los renglones 














La regla 3 indica que hay otro término —£ | ñ e . pero por la regla 4 este término es cero. ¡El 


paso de eliminación de costumbre no afecta al determinante! 


6. SiA tiene un renglón de ceros, entonces det A = 0. 


000 
cd 


Una demostración consiste en sumar otro renglón al renglón cero. Por la regla $, el deter- 
minante permanece sin cambio. Debido a que ahora la matriz cuenta con dos renglones 
idénticos, por la regla 4 se tiene que det A = 0. 


Renglón cero =0, 











7. SIA es triangular, entonces det A es el producto a,,4,7 * * : Agn de los elementos en la 
diagonal. Si la A triangular tiene 1s a lo largo de la diagonal, entonces det A = 1. 


a b E, 
Da d 


Demostración — Suponga que los elementos en la diagonal son diferentes de cero. Enton- 
ces la eliminación es capaz de eliminar todos los elementos fuera de la diagonal sin modi- 
ficar el determinante (por la regla 5). Si A es triangular inferior, los pasos son hacia abajo, 
como de costumbre. Si A es triangular superior, primero se trabaja con la última columna, 
utilizando múltiplos de a,,,. De cualquier forma se llega a la matriz diagonal D: 


Matriz triangular = ad = ad. 














211 
D = cd tiene det D = d11922 *** Gana detí = 41142 *** Gan 
Can 


Para encontrar det D, paciente se aplica la regla 3. Al factorizar a,, y luego a», y por último 
Any SE Obtiene la matriz identidad. Por fin tenemos una aplicación para la regla 1: det 7 = 1. 


$1 un elemento en la diagonal es cero, entonces la eliminación produce un renglón ce- 
ro. Por la regla 5, estos pasos de la eliminación no cambian el determinante. Por la regla 6, 
el renglón cero significa un determinante cero. Es decir: cuando una matriz triangular es 
singular (debido a un cero en la diagonal principal), su determinante es cero. 

Esta propiedad es fundamental. El determinante de todas las matrices singulares es 
cero. 





p 
| 
] 
al 
E 
53 
E 
a 
a q 
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8. SiA es singular entonces det A = 0. Si A es invertible, entonces det A +0. 


Matriz singular bs 2 no es invertible si y sólo si ad —bc =0. 


S1 A es singular, la eliminación produce un renglón cero en U. Así, det A = det U = 0. Si 
Á es no singular, la eliminación coloca los pivotes d,,..., d, en la diagonal principal. ¡Se 
tiene una fórmula para el “producto de pivotes” de det A! El signo depende de si el núme- 
ro de intercambio de renglones es par o impar: 


Producto de pivotes detA = + detU = > d ¡d>-: da. ed 
La regla nueve es la regla del producto. Yo diría que es la más sorprendente. 


9. El determinante de AB es el producto de det A por det B. 


a blle f|_ 
A o e ES 


ae +bg af +bh 


Regla del producto |A||B| =|AB]| A O 














Un caso particular de esta regla proporciona el determinante de A”7?. Debe ser 1/det A: 





detA7? = debido a que (det AMdet 47?) = det 447! =detl =1. (2) 


det A 
En el caso de 2 por 2, la regla del producto puede comprobarse pacientemente: 
lad — beXMeh — fg) = (ae + bgXcf +dh)-— (af + bhXce + dg). 


En el caso de n por n, se sugieren dos demostraciones posibles, ya que ésta es la regla me- 
nos evidente. En ambas demostraciones se supone que A y B son no singulares; en caso 
contrario, AB es singular, y la ecuación det AB = (det AXdet B) se comprueba fácilmente. 
Por la regla 8, se convierte en 0 = 0. 


1) Se demostrará que el cociente d(A) = det AB/det B cumple las propiedades 1 a 3. 
Así, d(A) debe ser igual a det A. Por ejemplo, d(D) = det B/det B = 1; se cumple 
la regla 1. Si se intercambian dos renglones de A, también se intercambian los mis- 
mos renglones de AB, y el signo de d cambia según lo requiere la regla 2. Una com- 
binación lineal en el primer renglón de A proporciona la misma combinación lineal 
en el primer renglón de AB. Luego la regla 3 para el determinante de AB, dividida 
entre la cantidad fija det B, lleva a la regla 3 para el cociente d(4). Así, (A) = det 
AB/det B coincide con det A, que es nuestra fórmula del producto. 

Esta segunda demostración es menos elegante. Para una matriz diagonal, det DB = 
(det D)(det B) se concluye al factorizar cada d, a partir de su renglón. Una matriz 
general A se reduce a D por eliminación —de A a U como de costumbre, y de U a 
D por eliminación hacia arriba. El determinante no cambia, excepto por una inver- 
sión de signo cuando se intercambian renglones. Los mismos pasos reducen AB a 
DB, con precisamente el mismo efecto sobre el determinante. Pero para DB ya se 
confirmó que la regla 9 es correcta. 


ij 


5 Nr? 


10. La traspuesta de A tiene el mismo determinante que A misma: det A? = det A. 


a b 
cd 


Es 
Da ka 


Regla de la traspuesta JA] = = = AT]. 














De nuevo, el caso singular se trata por separado; A es singular si y sólo si A? es singular, 
y se tiene O = 0. Si A es no singular, entonces permite la factorización PA = LDU, y se 
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aplica la regla 9 para el determinante de un producto: 


det P det A = det £ det D det U. (3) 
Al trasponer PA = LDU se obtiene AYPY = UTDYET, y de nuevo por la regla 9, 


det A* det PY = det U? det DY det L”. (4) 


Esto es más sencillo de lo que parece, ya que L, U, £*, y U* son triangulares con diagonal 
de 1s. Por la regla 7, su determinante es igual a 1. También, cualquier matriz diagonal es 
igual a su traspuesta: D = D”. Sólo es necesario demostrar que det P = det P”. 

Ciertamente, det P es l o —1, ya que P proviene de / por intercambios de renglones. 
También observe que PP* = 1. (El 1 en el primer renglón de P corresponde al 1 en la pri- 
mera columna de P*, y le faltan los 1s en las demás columnas.) En consecuencia, det P det 
PY = det I = 1, y P y P? deben tener el mismo determinante: ambos 1 o ambos —1. 

Se concluye que los productos (3) y (4) son los mismos, y entonces det A = det A*. 
Este hecho prácticamente duplica la lista de propiedades, ya que cada regla aplicada a los 
renglones puede aplicarse ahora a las columnas: el determinante cambia de signo cuando 
se intercambian dos columnas, dos columnas iguales (o una columna de ceros) producen 
un determinante cero, y el determinante depende linealmente de cada columna individual. 
La demostración consiste justamente en trasponer la matriz y trabajar con los renglones. 

Considero que es hora de guardar silencio y declarar que la lista está completa. Sólo 
queda encontrar una fórmula definitiva para el determinante, y aplicarla. 





qe Conjunto de problemas 4.2 
1. Si una matriz de 4 por 4 tiene det 4 = 3, encuentre det(24), det (—A), det (4%), y det : 
2. Si una matriz de 3 por 3 tiene det A = — 1, encuentre det(3 A), det (—A), det (4?) y | 
det (a75. , 


3. Intercambio de renglones: Sume el renglón 1 de A al renglón 2 y luego reste el ren- 
glón 2 del renglón 1. Luego sume el renglón 1 al renglón 2 y multiplique el renglón 1 
por —1 para llegar a B. ¿Cuáles reglas muestran lo siguiente? 


es igual a —detA = — 


c 4 
dep = b ea 








A 


Estas reglas pueden sustituir a la regla 2 en la definición de determinante. 


4. Aplique operaciones en los renglones para obtener una triangular superior U, para 
calcular 


l 2 


0 o A 
2. 3 -4 1 1. 2-1 0 

e E E 4 o A 
0 0 0-1 -2 


Intercambie los renglones 3 y 4 de la segunda matriz, y vuelva a calcular los pivotes 
y el determinante. 


er: l LAN CASARES SAR SMA ROTO RT AT OS DCI AC o OS PR MEC 


nada 


E 
GU o AAN ROA mt. E ; y 


e ere o ió 


10. 


11. 
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Nota Algunos lectores ya conocerán alguna fórmula para calcular determinantes de 
3 por 3. Tiene seis términos (ecuación (2) de la siguiente sección); tres son paralelos 
a la diagonal principal y otros tres van en dirección opuesta con signo menos. Hay una 
fórmula semejante para determinantes de 4 por 4, aunque contiene 4! = 24 términos 
(no sólo ocho). Ni siquiera es posible estar seguro de que un signo menos va con la 
diagonal invertida, como se muestra en el siguiente ejercicio. 


Cuente los intercambios de renglones para encontrar los siguientes determinantes: 


02040: 1 05 E 070 
0.0 TT 0 050: 4.50 
det oa +1 y det a =1 
10.00 LADO 0 
Para cada n, ¿con cuántos intercambios se coloca el (renglón n, renglón n — 1l,..., 
renglón 1) en el orden normal (renglón 1,... , renglón n — 1, renglón n)? Encuentre 


det P para la permutación de n» por n con unos en la diagonal invertida. En el proble- 
ma $ se tenía n = 4. 


Encuentre el determinante de: 


a) Una matriz de rango 1 
l 
A=|4|[2 —1 2). 
2 


b) La matriz triangular superior 


.= 


Oo0O% 
O Omni 
O mn N 0 
bp dh hn 0 


c) La matriz triangular inferior U”. 
d) La matriz inversa UT”!. 
e) La “matriz triangular invertida” que resulta de intercambios de renglones, 


00 0 
Os 0 26 
a A 

4 4 8 8 


Demuestre cómo la regla 6 (det = O si un renglón es cero) proviene directamente de 
las reglas 2 y 3. 


Suponga que realiza dos operaciones a la vez, yendo de 
4 b a a=mc Má 
En a cta tds bs | 
Encuentre el determinante de la nueva matriz, aplicando la regla 3 o por cálculo directo. 


Si O es una matriz ortogonal, de modo que O0*O = 1, demuestre que det O es igual a 
+1 0 —1. ¿Qué tipo de caja se forma a partir de los renglones (o las columnas) de Q? 


Demuestre otra vez que det O = 1 o —1, usando sólo la regla del producto. Si [det O] 
> 1, entonces det O” explota. ¿Cómo se sabe que esto no puede ocurrir a DA 





Se RRA AN 


e A 
A PR A pi 
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12. Use operaciones en los renglones para justificar que el “determinante de Vandermon- 
de” de 3 por 3 es 


Da 
det |1 b b?1=(b-— aXe— ac — b). 
le Es 
13. a) Una matriz simétrica sesgada cuinple K* = —K, como en 
0 a b 
K=|-a Sa 
E O. 


En el caso de 3 por 3, ¿por qué det (—K) = (—1)? det K? Por otra parte, det K* = 
det K (siempre). Deduzca que el determinante debe ser cero. 
b) Escriba una matriz simétrica sesgada de 4 por 4 con det K diferente de cero. 


14, ¿Falso o verdadero? Proporcione una razón si es cierto, y un contraejemplo si es fal- 
so. 


a) Si A y B son idénticas excepto que b,; = 2a,,, entonces det B = 2 det A. 
b) El determinante es el producto de los pivotes. 

c) Si A es invertible y B es singular, entonces A + B es invertible. 

d) Si A es invertible y B es singular, entonces AB es singular. 

e) El determinante de AB — BA es cero. 





15, Si la suma de cada renglón de A es cero, demuestre que det A = 0. Si la suma de ca- 


da renglón es 1, demuestre que det (4 — /) = O, Demuestre con un ejemplo que esto 
no implica que det A = /. 





16. Encuentre los siguientes determinantes de 4 por 4 por eliminación gaussiana: 
ii 12 13 14 re SE 
pen 2 UM e O A A 
31 32 33 34 , dio 00 
41 42 43 44 a E El 


17. Encuentre los determinantes de 
2 AL 3 —2 A a AA Z 
a=|; A ds =5l- Ae ds 1 =| 1 Ed 


¿Para qué valores de A se cumple que 4 — Af es una matriz singular? 


18. Evalúe det A reduciendo la matriz a forma triangular (reglas 5 y 7). 


E LV y A MEE, 
4=|0 4 6], B=j0 4 6l, C=J¡0 4 6l. 
1 5.8 Gui8” 1 L SS 


¿Cuáles son los determinantes de B, C, AB, ATA, y CF? 


19. Suponga que CD = — DC, y encuentre la falla en el siguiente razonamiento: Al tomar 
determinantes se obtiene (det CMdet D) = —(det Ddet C), de modo que det C = 0 
o det D = 0. Así, CD = — PC sólo es posible si C o D es singular. 


. , 

e e AA 4, ' : 

ANS e ng, des ' PO ¿ ; , , 

A A Ra A A ios RIO 





20. 


21. 
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¿El determinante de las siguientes matrices es igual a O, 1, 2, o 3? 


00. dl E IÓ a 
E A O E A | 
Te PO LA 


Parece que la inversa de una matriz de 2 por 2 tiene determinante = 1: 


1 E lA 


a do aaen 
' ads bles pal adobe 


¿Qué está mal en este cálculo? ¿Por qué es correcto det A7*? 


En los problemas 22 a 28 se usan reglas para calcular determinantes específicos. 


22. 


24. 


26. 


27. 
28, 


29. 


Reduzca A a U, y encuentre det A = producto de los pivotes: 


1 A lZS 

A=|1 2 2 y A=/|2 2 3 

¡E NS: DU a 

. Aplique operaciones en los renglones para obtener una triangular superior U, y calcule 

AS A O | 

2 000: 1 EZ A 

e E A 

O 2200 0 E: A: E 


Aplique operaciones en los renglones para simplificar y calcular los siguientes deter- 
minantes: 
101 201 301 E 
det | 102 202 302 y debil. Et 
103 203-303 E 2 | 
. La eliminación reduce A a U. Luego, A = LU: 
3-3 4 O 5 A 0 TN ES A AE 
A=106 8 Ts 2: Y 0110 2 =1l=£0 
a E =L 4 1 o | 


Encuentre los determinantes de L, U, A, UT*L7?, y U7 VEA: 


Si ay es ¿ multiplicado por j, demuestre que det A = O. (Con la excepción cuando 
A = [1], 


Si a es i + j, demuestre que det A = O. (Con la excepción cuando 1 = 1 0 2.) 


Calcule los determinantes de las siguientes matrices, mediante operaciones en los ren- 
glones: 


0 a 0 0 
0 a 0 0O0bB0 a a 4 
A=Jj0 0 bd], B= , y C=ja b b 
cci0N TO ES a be 
d 0.000 
¿Cuál es el error en la siguiente demostración de que las matrices proyección cumplen 
det P = 1? 





P=A(AFAJ A?  demodoque |P|=|A] par] = 1. 


1 
147 14] 


A A z 
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30. (Problema de cálculo) Demuestre que las derivadas parciales de In(det A) proporcio- 
nan A”? 

ES CE af/da. 0/00 
fta,b,c,d) =Intad — bc) conduce a Eidos 9f/9d =A". 

31. (MATLAB) La matriz de Hilbert hitb(n) tiene el elemento ¿, j igual a V/(¿ + 1). 
Imprima los determinantes de hilb(1), hilb(), ... , hilb(0). ¡Es difícil trabajar con 
las matrices de Hilbert! ¿Cuáles son los pivotes? 

32. (MATLAB) ¿Cuál es un determinante típico (experimentalmente) de randín) y 
randní(n) para n = 50, 100, 200, 400? (¿ Y qué significa “Inf” en MATLAB?) 

33. Use MATLAB para encontrar el determinante más grande de una matriz de 4 por 4 de 
Os y 1s. 

34. Sise sabe que det A = 6, ¿cuál es el determinante de B? 

renglón 1 renglón 1 + renglón 2 
detA = | renglón 2| =6 det B = | renglón 2 + renglón3;¡= ___ 
renglón 3 renglón 3 + renglón 1 

35. Suponga que la matriz M de 4 por 4 tiene cuatro renglones iguales, todos contenien- 
do a, b, c, d. Se sabe que det(M) = 0. El problema es encontrar det(7 + M) por cual- 
quier método: 

+0 b € d 
E 1+b E d 
det(l + M) = A b A d 
a b c 1+d 
Crédito parcial si encuentra este determinante cuando a = b = c = d= 1. Eliminado 
de inmediato si afirma que det(I + M) = det ] + det M. 
qe 4.3 FÓRMULAS PARA EL DETERMINANTE 


La primera fórmula ya apareció. Las operaciones en los renglones producen los pivotes en D: 





En el caso de 2 por 2, la factorización estándar LDU es 


Bl pro RA 0 a 0 Libia 
cai Mea Y E ad E A 


El producto de los pivotes es ad — bc. Este es el determinante de la matriz diagonal D. Si 
el primer paso es un intercambio de renglones, entonces los pivotes son c y (— det Ayc. 





Ejemplo 1 
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Los pivotes de la matriz —1, 2, —1 en segundas diferencias son 2/1, 3/2, ...en D: 
2 2 
1] | Eo 
—] Ze . = LDU =L 4/3 te 
: | Ñ 
E 2 (n + YY n 
Su determinante es el producto de los pivotes. Todos los números 2,...., n se cancelan: 





e 


MATLAB calcula el determinante a partir de los pivotes. Sin embargo, concentrar toda la 
información en los pivotes hace imposible imaginarse cómo el cambio en un elemento pue- 
de afectar al determinante. Se desea encontrar una expresión explícita para el determinan- 
te en términos de los n? elementos. 


Para n = 2, se demostrará que ad — bc es correcto. Para n = 3, la fórmula del deter- 
minante es bastante bien conocida (tiene seis términos): 


da € 413 

e Pe +411422433 + 412023031 + 413021432 0) 
—41¡43303 — 41242433 — 413422431. 

da1 4 A 


Nuestro objetivo es deducir estas fórmulas directamente a partir de las propiedades defini- 
torias 1 a 3 de det A. Si es posible manejar n = 2 y n = 3 de manera organizada, podrá ver- 
se el patrón. 

Para empezar, cada renglón puede descomponerse en vectores en las direcciones de 
coordenadas: 


[a b]=[0 


Luego se aplica la propiedad de linealidad, primero al renglón 1 y luego al renglón 2: 


A E NO E dl O E 














Pe E >> a 0 + O b 

c dl “le d c d 
Separar en 
a" = 2 o O 
determinantes fáciles E A ER 0 AE 20 +lo A (3) 











Cada renglón consta de n direcciones de coordenadas, por lo que su desarrollo contiene n? 
términos. La mayor parte de tales términos (todos menos n! = n factorial) son automática- 
mente cero. Cuando dos renglones están en la misma dirección de coordenadas, uno es 
múltiplo del otro, y 


cu 0 =4 





E 


Se presta atención sólo cuando los renglones apuntan en distintas direcciones. Los térii- 
nos diferentes de cero deben estar en columnas distintas. Suponga que el primer renglón 
tiene un elemento diferente de cero en la columna e, el segundo, un elemento diferente de 
cero en la columna £, y que finalmente el renglón n-ésimo tiene un elemento diferente 
de cero en la columna v. Todos los números de columna a, £,.. ., v son diferentes. Son 
un reordenamiento, o permutación, de los números 1, 2, ...,n. El caso de 3 por 3 pro- 


212 Capítulo 4 Determinantes 


duce 3! = 6 determinantes: 


aa 4 413 211 412 013 
da Gs d2a|= a22 E 423 | + |021 
ada 3 33 433 231 432 
a11 212 413 
za da | + ¡a + 022 : (4) 
a32 33 031 


Excepto estos n! determinantes, todos los demás son cero porque la columna se repi- 
te. (Para la primera columna « hay n opciones, para 8 hay n — 1 opciones restantes, y por 
último, queda una opción para la última columna v. Cada vez se utiliza una sola columna, 
cuando se “serpentean” los renglones de la matriz). En otras palabras, hay n! formas de 
permutar los números 1,2,...,n. Los números de columna proporcionan las permuta- 
ciones: 


Números de columna (xa, 8, v) =(1, 2, 3), (2, 3, 1), (3, 1, 2), (1, 3, 2), (2, 1, 3), (3, 2, 1). 


Hay 3! = 6 permutaciones de (1, 2, 3); la primera es la identidad. 
El determinante de A se reduce ahora a seis determinantes por separado y mucho más 
sencillos. Al factorizar ay, para cada una de las seis permutaciones hay un término: 


1 1 1 
det A = a11422433 1 + 412423431 11 + ajzazida2 | 1 
1 1 1 


+ 411423432 1| + aj2a71433 | 1 + 413022031 1 . (5) 
1 1 1 


Cada término es un producto de n = 3 elementos a;;, donde cada renglón y cada columna 
están representados una vez. Si el orden de las columnas es («, ... , yv), ese término es el 
producto de Aja - > * ay por el determinante de una matriz permutación P. El determinan- 
te de toda la matriz es la suma de estos n! términos, y esa sumatoria es la fórmula explí- 
cita que se está buscando: 


A ÓR A OS e A O O 
AN ara Y As iio MARA 
e AS A A IAN A 


detA = > (a1228 > ** Anv) det PM 
odas las Ps 


AP o CA a 
SES A e o e, dE ES NN OR 





Para una matriz de n por n, esta sumatoria se toma sobre todas las 1! permutaciones 
(a, ... ,v) de los números (1, ...,n). La permutación proporciona los números de co- 
lumna a medida que se desciende por la matriz. Los 1s aparecen en P en los mismos si- 
tios en que las as aparecían en A. 

Queda por encontrar el determinante de P. Los intercambios de renglones transforman 
P en la matriz identidad, y cada intercambio cambia el signo del determinante: 


det P = +10 —1 para un número par o impar de intercambios de renglones. 


es impar, pe es par, 
(1,3,2) de modo que : 11=-=1 (6,1,2) de modo que . ; E 





Ejemplo 2 
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(1, 3, 2) requiere un intercambio y (3, 1, 2) requiere dos intercambios para recuperar (1, 2, 
3). Estos son dos de los seis signos +. Para n = 2, sólo se tiene (1, 2) y (2, 1): 


1 0 
det A = aa det E 4 + 2419471 det E h = 41/42 7 Ga21 lo ad — bc). 


Nadie puede afirmar que la gran fórmula (6) es particularmente simple. Sin embargo, 
es posible darse cuenta de por qué tiene las propiedades 1 a 3. Para A = 1, todo producto 
de los a, es cero, excepto por la sucesión de columnas (1, 2,... xn). Este término propor- 
ciona det] = 1. La propiedad 2 se comprobará en la siguiente sección, porque aquí se tie- 
ne más interés en la propiedad 3: el determinante debe depender linealmente del primer 


renglón 2,1, 412, +. . > Ain: 
Considere a todos los términos aj,4>g : : : Any que implican a a4,;. La primera colum- 
na es a = 1. Esto deja alguna permutación (8, ... , v) de las columnas restantes (2,..., 


1). Todos estos términos se agrupan como a,,Cy,, donde el coeficiente de a,, es un deter- 
minante más pequeño, al que se han retirado el renglón 1 y la columna 1: 


Cofactor dea,, Ci = S (ar *«*Apy) det P = det (submatriz de A) (7) 


De manera semejante, el elemento a,2 se ha multiplicado por algún determinante más pe- 
queño Cy2. Al agrupar todos los términos que empiezan con el mismo a;;, la fórmula (6) se 
convierte en 


Cofactores a lo largo del renglón 1 detA = a¡¡Ci1 + aC +: +anCi. (8) 
. , 4], del primer 


Esto demuestra que det A depende linealmente de los elementos a;;, ... 
renglón. 


Para una matriz de 3 por 3, con esta manera de agrupar términos se obtiene 


det A = aj¡(47243 — 423432) + ar2[ad79343, — 421433) + ajz(A21as2 — Azr2431). (9) 


Los cofactores C;;, C;2, C¡3 son los determinantes de 2 por 2 entre paréntesis. 


Desarrollo de det A por cofactores 


Se busca otra fórmula más para el determinante. Si esto significa partir de cero, sería de- 
masiado. Sin embargo, la fórmula ya está descubierta: es (8), y la única cuestión es iden- 
tificar los cofactores C, ; que multiplican a ay. 

Se sabe que C,; depende de los renglones 2, ...,n. El renglón 1 ya está tomado en 
cuenta por a; , Además, a, , también toma en cuenta la columna j-ésima, de modo que su 
cofactor C,, debe depender por completo de las otras columnas. Ningún renglón ni colum- 
na puede usarse dos veces en el mismo término. Lo que realmente se está haciendo es se- 
parar el determinante en la siguiente suma: 

Separación [aj ar 413 a11 a12 413 
en laa da da|= da %a3|+|42 3 |+|d1 22 
cofactores dai Un 33 da 33 231 233 as 3 

Para un determinante de orden n, esta separación origina n determinantes más pequeños 
(menores) de orden n — 1; se puede ver las tres submatrices de 2 por 2. La submatriz My, 
se forma quitando el renglón 1 y la columna ¡. Su determinante se multiplica por a;;, así co- 
mo por un signo más o menos. Estos signos alternan como en det M,,, —det M2, det M3: 
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Ejemplo 3 


| á 48 El determinante de Ae es una , combinación « E le cualquier renglón ¿ multiplicado 
POL: sus 'Ccofactores: * OO Pa 


A 


Cofactores del renglón 1 C¡, = (—1) "Y det M,,. 


El segundo cofactor C¡, €S 47343; — 471,433, que es det M,2 multiplicado por —1. Esta mis- 
ma técnica funciona en toda matriz de n por n. La separación anterior confirma que Cy, es 
el determinante del ángulo inferior derecho Mi ;. 

Hay un desarrollo semejante en cualquier otro renglón, por ejemplo ¿. Puede demos- 
trarse intercambiando el renglón ¿ con el renglón 1. Recuerde borrar el renglón i y la co- 
lumna j de A paa A 


peo so de a E 












Ci Fai. 


e - detá y por cofactores +] deta - = Ca + 22Ca E 


E 3 cofactor E; y es el determinante de M, con el 1 signo correcto: os ca A: 


_ borrar e ! renglón i y la columna aj Cu ne ds j det 7% En , a D 


Estas fórmulas expresan det A como una combinación de determinantes de orden 
n — 1. Hubiera sido posible definir el determinante por inducción sobre n. Una matriz de 1 
por 1 tiene det A = a;;, y así la ecuación (10) define los determinantes de las matrices de 
2 por 2, de 3 por 3, y de n por n. Aquí se prefirió definir un determinante según sus propie- 
dades, que son mucho más simples de explicar. La fórmula explícita (6) y la fórmula de co- 
factores (10) se concluyeron directamente, a partir de esas propiedades. 

Hay una consecuencia más de det A = det A”. Es posible desarrollar por cofactores de 
una columna de A, que es un renglón de A*. Siguiendo por la columna j de A, 


det A = gy + 09€ + *** +anjCnj> (2) 
La matriz en segundas diferencias A4 de 4 por 4 sólo tiene dos elementos diferentes de ce- 
ro en el renglón 1: 
2 dl 0 0 
il Dd 0 
O =1 2 al 
0 00 =L Z 


C¡ proviene al borrar el renglón 1 y la columna 1, quedando así el patrón — 1,2, —1: 


Usar cofactores Aj = 


eL 0 
Ci, = det A3 = det | —1 a! 
0-1 Z 
Para a, = —1, la columna eliminada es la 2, y se requiere su cofactor C;»: 
do Al 0 2 -1 
Cum = (1D? det 0 2 =11= +det| | = det Az. 
0 -1 2 A 


Así se queda con el determinante de 2 por 2. En total, el renglón 1 ha producido 2C;¡; — Cy: 
det Ag = 2(det A3) — det A = 2(4) -3=5 
La misma idea es válida para As y Ag, así como para toda A,,: 


Recurrencia por cofactores det A, = 2(det A,--1) — det Ar-2. (13) 


a 
PS 
PARA 


| 
| 
| 
| 
| 
| 
| 
, 





91173, 6 
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Lo anterior proporciona el determinante de matrices cada vez más grandes. En cada paso, 
el determinante de A, es n + 1, a partir de los determinantes previos n y n — 1: 


matriz — 1,2, —1 det A, =200) — (n-1)=n+1. 


La respuesta n + 1 coincide con el producto de pivotes al inicio de esta sección. 





Conjunto de problemas 4.3 


1. 


Para las siguientes matrices, encuentre el único elemento diferente de cero en la gran 
fórmula (6): 


O 
0 
iS 6 


= O == O 


l 0 
0 0 
l 1 
0 0 


OO -— O 


Sólo hay una forma de elegir cuatro elementos diferentes de cero de renglones distin- 
tos y columnas distintas. Al decidir par o impar, calcule det A y det B. 


Desarrolle estos determinantes en cofactores en el primer renglón. Encuentre los co- 
factores (incluyen los signos (—1y*) y los determinantes de A y B. 


¿Falso o verdadero? 

a) El determinante de S”*AS es igual al determinante de A. 

by Si det A = O, entonces por lo menos uno de los cofactores debe ser cero. 
c) Una matriz cuyos elementos son Os y 1s tiene determinante 1, 0, o —1. 


a) Encuentre la factorización LU, los pivotes, y el determinante de la matriz de 4 por 
4 cuyos elementos son aj; = el menor de i y j. (Escriba la matriz.) 

b) Encuentre el determinante si a, = el menor de n, y n;, donde n, = 2, n, = 6, nz = 8, 
n¿ = 10, ¿Puede proporcionar una regla general para cualquier n¡ < N2 < n3 S n4? 


Sea F,, el determinante de la matriz tridiagonal 1, 1, —1 (de n por n): 


Li 
l sl 
F, = det 1 1 —-1 
IL E 
Desarrolle por cofactores a lo largo del renglón 1, para demostrar que F, = Fy_¡ + 
F 2. Esto lleva a la sucesión de Fibonacci 1, 2, 3,5, 8, 13, .. . para los determinantes. 


Suponga que A, es la matriz tridiagonal n por n con 1s en las tres diagonales: 


1 1 E Ub 0 
A¡ = [11 42=|| id Az = ES 
NS 


Sea D, el determinante de A,,; se requiere encontrarlo. 


a) Desarrolle por cofactores a lo largo del primer renglón para demostrar que D, = 
D n=t D a=Z+ 

b) Empiece con D; = 1 y D, = 0, para encontrar Dy, Da, ..., Dg. Observe la mane- 
ra en que estos números se repiten (¿con qué periodo?), y encuentre D; 000: 


| 
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7. a) Evalúe el siguiente determinante por cofactores del renglón 1: 


4 4 4 4 
2 00 
PO 0 IE 
O: LA 0 2 


b) Compruebe restando la columna 1 de las demás columnas, y vuelva a calcular. 


8. Calcule los determinantes de A», A3, Ay. ¿Puede pronosticar A,,? 


0 1 11 

o 
A2= [2 ol A E 
ER 1.1 10 


Use operaciones en los renglones para producir ceros, o use los cofactores del renglón 1. 


9. ¿Cuántas multiplicaciones se requieren para encontrar un determinante de n por n a 
partir de 


a) la gran fórmula (6)? 
b) la fórmula de cofactores (10), construyendo a partir del conteo para n — 1? 
c) la fórmula del producto de pivotes (incluyendo los pasos de eliminación)? 


10. En una matriz de 5 por $, ¿un signo + o un signo — con a15424033442451 invierte la 
diagonal? En otras palabras, P = (5, 4, 3, 2, 1) ¿es par o impar? El patrón de tablero 
de ajedrez de signos + para cofactores no proporciona det P. 


11. SiA es de m por n y B es de n por m, explique por qué 


e A (Sugerencia: posmultiplicar | 7 0 
sd a 7 | a ( por la derecha por) Bo dl 


Proporcione un ejemplo con m < n, y un ejemplo con m > n. ¿Por qué su segundo 
ejemplo automáticamente tiene det AB = 07? 


12. Suponga que la matriz Á es fija, excepto que a,, varía desde —oo0 hasta +00. Propor- 
cione ejemplos en los cuales det A siempre es cero o nunca es cero. Luego, a partir del 
desarrollo por cofactores (8), demuestre que en caso contrario det A = O para exacta- 
mente un valor de a;,;. 


En los problemas 13 a 23, use la gran fórmula con 1! términos: JA] = Y; + 01.428 
E? PES 


13, Calcule los determinantes de A, B, C, a partir de seis términos. ¿Sus renglones son in- 


dependientes? 
¡ES ¡E LA 
A= 1 IZ B=j¡4 4 4 Co=ib to 0, 
| OL 1.00 


14, Calcule los determinantes de A, B, C. ¿Sus columnas son independientes? 


E E $, LIZ 3 
a=lio 1] m=|as 6 c=[1 2] 
JS E - 





15, 


16. 


AíS 


18 


» 


19. 


20. 


21. 


22. 


23. 
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Demuestre que det 4 = O, sin importar los cinco elementos diferentes de cero indica- 
dos por las xs: 


a 
ASEO 0 (¿Cuál es el rango de A?) 
05 20- % 


Este problema muestra en dos formas que det A = O (las xs son números cualesquiera): 


5 EM do 2 E > 

o E E E matriz de 3 por 5 
A=|0 0 0 x x= matriz cero de 3 por 3 

OOO Siempre es singular 

0 00 


a) ¿Cómo se sabe que los renglones son linealmente dependientes? 
b) Explique por qué todos los 120 términos son cero en la gran fórmula para det A. 


Encuentre dos formas para elegir elementos diferentes de cero, a partir de cuatro ren- 
glones y columnas diferentes: 


IED Os 1 E 0 E 2 
AO de da QS de 35 : : 
A= E B= 5 4 0 361 (B tiene los mismos ceros que 4). 
10.0 1 2 80:01 


det A, ¿esigualal +101-—lo—l1-—1?¿A qué es igual det B? 


Coloque el menor número de ceros en una matriz de 4 por 4 que garantice det A = 0. 
Coloque tantos ceros como sea posible permitiendo a la vez que det 4 + O. 


a) Si 411 = 42 = 433 = O, ¿cuántos de los seis términos en det A son cero? 
b) Si a,¡ = 42 = 433 = Gaga = 0, ¿cuántos de los 24 productos 4; ¡02x43204m en det A 
es seguro que son cero? 


¿Cuántas matrices permutación de $ por $ tienen det P = +17 Estas son permutacio- 
nes pares. Encuentre una que requiera cuatro intercambios para llegar a la matriz iden- 
tidad. 


Si det A + O, por lo menos uno de los n! términos en la gran fórmula (6) no es cero. 
Deduzca que algún ordenamiento de los renglones de A no deja ceros en la diagonal. 
(No use P de la eliminación; esa PA puede tener ceros en la diagonal.) 


Demuestre que 4 es el determinante más grande para una matriz de 3 por 3 de ls po- 
sitivos y 1s negativos. 


¿Cuántas permutaciones de (1, 2, 3, 4) son pares, y cuáles son? Crédito extra: ¿Cuá- 
les son todos los posibles determinantes de 4 por 4 de 1 + Poar? 


En los problemas 24 a 33 se usan cofactores C;; = (—1)'*1 det M;;- Elimine el ren- 
glón í, columna /. 


24. 


Encuentre cofactores, y luego trasponga. ¡Multiplique CT y CL porA y B! 


1 
E 
E 
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25, 


26. 


ada 


28. 


29. 


30. 


Encuentre la matriz por cofactores C, y compare AC* con A”?: 


2 NS. 1 A 
O el E A*?= 7 2-4 Zi 
a ¡ES 


La matriz B, es la matriz A, —1, 2, —1, excepto que b,, = 1 en vez de a,, = 2. Use 
cofactores del último renglón de By, para demostrar que | By] = 2]B3| — | B>| = 1: 


(+ L 


11 
B4 = ' a a =i B3, = =1 DL 
iS =>. 2 
La recurrencia | B,| = 2] B, ¡| — | B,,.-,] es la misma que para las As. La diferencia 


es en los valores iniciales 1, 1, 1 paran = 1, 2, 3. ¿Cuáles son los pivotes? 


B,, sigue siendo igual a A,, excepto por b,, = 1. Así, use linealidad en el primer ren- 
glón, donde [1 —1 0] es igual a [2 —1 0] menos [1 0 0]: 


=1 0 aL 0 150 0 
| _ la ES 
| Ba] E AS > An-1 An-1 
0 0 0 


La linealidad en el renglón 1 proporciona | B,,| = l4pl — lAn-11 =__. 
El determinante C, de n por n tiene 1s arriba y abajo de la diagonal principal: 


0 


Ci = JO] c=! 0 


| 6- 


O == O 


¡qe 3, 
07 Ca4 = 
1 0 


O >» O 


0 
1 
0 
1 


O Oo 


1 
0 
0 


a) ¿Cuáles son los determinantes de C¡, C2, C3, Ca? 
b) Por cofactores, encuentre la relación entre C, y C,..y y C,-2. Encuentre C;yo. 


En el problema 28 se tienen 1s justo arriba y abajo de la diagonal principal. Descen- 
diendo en la matriz, ¿qué orden de las columnas (en caso de haber alguno) proporcio- 
na todos los 15? Explique por qué esa permutación es par para n = 4,8,12,...,e 
impar para n = 2,6,10,... 


C, = 0 (n impar) C, =1ín =4,8,...) Ca Ll = 2 bs 


Explique por qué el siguiente determinante de Vandermonde contiene a 1? pero no a 


ox: 











Esa. as a? 
TO > 
O e O ES. 
E EE 
El determinante es cero en x = y y . El cofactor de x es V3 = (b — a) 


lc — ade — b). Así, Va = (x — aXx — bx — c)v. 
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31. Calcule los determinantes S,, S,, S3 de las siguientes matrices tridiagonales: 


dl 


S; =|3| 5. =| A 


E E E, 
| $ =|1 3 11 
SES 


Haga una conjetura de Fibonacci para Sy, y compruebe que tiene razón. 


32. Los cofactores de estas matrices 1, 3 1 proporcionan S, = 3S,4-1 — Sn-2. Desafío: De- 
muestre que S, es el número de Fibonacci F»,. 2 al demostrar Fan+s = 3 Fon — Fan. 
Siga utilizando la regla de Fibonacci F, = Fi-y + Fg-2. 


33. Cambie 3 por 2 en la esquina superior izquierda de las matrices en el problema 32, 
¿Por qué se resta S,, , del determinante S,? Demuestre que los determinantes se con- 
vierten en los números de Fibonacci 2, 5, 13 (siempre F,4 1). 


Los problemas 34 a 36 son sobre matrices en bloque y determinantes en bloque. 
34. Con bloques de 2 por 2, ¡no siempre es posible usar determinantes en bloque! 


A B A B 
O D=IAND pero [E 5 AIANDI=ICI1AL 


a) ¿Por qué es cierta la primera afirmación? De alguna manera, B no entra. 
b) Demuestre con un ejemplo que la igualdad falla (como se muestra) cuando entra C. 
c) Demuestre con un ejemplo que la respuesta det(4D — CB) también es errónea. 


35. Con multiplicación por bloques, A = LU tiene A, = L¿U, en la esquina superior i2- 


quierda: 
AE Ar ES 2 Li 0 Us * 
Cleo *o o R=|1|0 0 |' 


a) Suponga que los tres primeros pivotes de A son 2, 3, —1. ¿Cuáles son los determi- 
nantes de £¡, La, L¿ (con 1s en la diagonal), U,, Uz, Uz, y Aj, Az, Az? 
b) Si A;, Az, A3 tienen determinantes S, 6, 7, encuentre los tres pivotes. 


36. En la eliminación por bloque se resta CA” * multiplicado por el primer renglón [A B] 
del segundo renglón [C DJ]. Así, en la esquina queda el complemento de Schur D — 


CA *B: 
I OJ[A BJ] _ [A B 
=CA*?* IlC DI 10 D=CATB]I' 


Tome determinantes de estas matrices para demostrar reglas correctas para bloques 
cuadrados: 


= JA]]D—CA7 B| = ¡AD —CB|. 


Sol 
si A“! existe SAC =CA 


E> 0 


37. Un determinante de 3 por 3 tiene tres productos “abajo a la derecha” y tres “abajo a la 
izquierda” con signos menos. Calcule los seis términos de la figura para encontrar D. 
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Luego explique sin determinantes por qué la siguiente matriz es invertible o no: 





=> o. - ++ + 


38. Para Ay en el problema 6, cinco de los 4! = 24 términos en la gran fórmula (6) son di- 
ferentes de cero. Encuentre estos cinco términos para demostrar que D¿ = —1. 


39. Para la matriz tridiagonal de 4 por 4 (elementos —1, 2, —1), encuentre los cinco tér- 
minos en la gran fórmula con los que se obtiene det A =16—4-—4-—4-+ 1. 


40. Encuentre el determinante de la siguiente matriz cíclica P por cofactores del renglón 
1. ¿Con cuántos intercambios se reordena 4, 1, 2,3 en 1,2,3,4? es ¿LP = +]10-—1? 


0.0.0 1 OOO 

E E E 
0.1.0.0 107050 OS 
0.0100 0.1.0.0 


41. A=2*eye (n)—diag(ones(n— 1, 1), 1)—diag(ones(n—1, 1),— 1) es la matriz —1, 
2, —1. Cambie A(l, 1) a 1 de modo que det A = 1. Pronostique los elementos de A”? 
con base en n = 3, y pruebe su conjetura para n = 4. 


42. (MATLAB) Las matrices —1, 2, —1 tienen determinante n + 1. Calcule (n + 1947? 
para n = 3 y 4, y compruebe su conjetura para n = 5. (Las inversas de las matrices 
tridiagonales tienen la forma uv* de rango 1 arriba de la diagonal.) 


43. Todas las matrices de Pascal tienen determinante 1. Si 1 se resta del elemento 1, n, 
¿por qué el determinante se vuelve cero? (Use la regla 3, o cofactores). 


E E: E | ¡E AS A | 
det : . - BN = 1 conocido det : z E SA = 0 (explique). 
14 10 20 1 4 10 19 
E 4,4 APLICACIONES DE LOS DETERMINANTES 


En esta sección se desarrollan cuatro aplicaciones fundamentales: la inversa de A, la solu- 
ción de Ax = b, el volumen de cajas y los pivotes. Estas aplicaciones se encuentran entre 
los cálculos clave en álgebra lineal (realizados por eliminación). Los determinantes propor- 
cionan fórmulas para las respuestas. 


1. Cálculo de A7?. El caso de 2 por 2:ilustra cómo los cofactores van en A”?: 


h AA d -b]_ 1 [Ci Ca 
c d ads be a detA [Cir Caj| 
Se está dividiendo entre el determinante, y A es invertible exactamente cuando det A es di- 


ferente de cero. El número C,, = d es el cofactor de a. El número C,2 = —c es el cofac- 
tor de b (observe el signo menos). ¡Ese número C,, va en el renglón 2, columna 1! 





Ejemplo 1 
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El renglón a, b multiplicado por la columna C;;¡, C¡. produce ad — bc. Este es el de- 
sarrollo por cofactores de det A. Esta es la pista que se requiere: A7* divide los cofactores 
entre det A. 






det A sien ey "det y 














€ stá traspuesta 


Nuestro objetivo es comprobar esta fórmula para A”!. Es necesario ver por qué AC? = (det 
A): 


411 :***  QOin Cu += En detA .-- 0 
: : : 30 : 3 E (2) 
Ga. 25% Aón Cir ss Es 0 c.. detA 
Con los cofactores C;¡, ..., Cy, en la primera columna y no en el primer renglón, se 
multiplican a 411, . . . , 4, Y proporcionan el elemento diagonal det A, Cada renglón 


de A multiplica a sus cofactores (el desarrollo por cofactores) para obtener la misma res- 
puesta det A sobre la diagonal. 

La pregunta crítica es: ¿Por qué se obtienen ceros fuera de la diagonal? Si se combi- 
nan los elementos a, del renglón 1 con los cofactores C, del renglón 2, ¿por qué el resul- 
tado es cero? 


renglón 1 de A, renglón 2 de € a11C31 sr ar Ca q... a Gin Can =0, (3) 


La respuesta es: se está calculando el determinante de una nueva matriz B, con un nuevo 
renglón 2. El primer renglón de A se copia en el segundo renglón de B. Así, B tiene dos 
renglones iguales, y det B = 0. La ecuación (3) es el desarrollo de det B a lo largo de 
su renglón 2, donde $B tiene exactamente los mismos cofactores que A (porque el segundo 
renglón se elimina para encontrar esos cofactores). La extraordinaria multiplicación matri- 
cial (2) es correcta. 

Esa multiplicación AC” = (det A)/ proporciona de inmediato 4” *, Recuerde que el co- 
factor al borrar el renglón i y la columna j de A va en el renglón j y en la columna i de C*. 
Al dividir entre el número det A (¡en caso de no ser cero!) se obtiene 47! = CT/det A. 


La inversa de una suma de matrices es una matriz en diferencias: 





O | CT 1-1 0 
A=l|0 1 1| tiene er al 0 1 —] 
0.0 1 ás 0 0 1 


El signo menos entra porque los cofactores siempre incluyen a (— 1), 


2. Lasolución de Ax =b. La multiplicación x = A” *b es justo C*b dividido entre det 
A. el una forma conocida de escribir la cla Cr o did 


AS y o ALAN 
>» PDA odas Li 








Laj .Jésima a componente d dex xs = Abe es sel cociente | 





us 
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Ejemplo 2 


Demostración B, se desarrolla por cofactores de su columna /-ésima (que es b). Como los 
cofactores ignoran esa columna, det B; es exactamente la j-ésima componente en el produc- 
to CTb: 

det Bj = b1Ci; $ b2C2; +o + bCnoj 
Al dividir lo anterior entre det A se obtiene x;. Cada componente de x es un cociente de dos 
determinantes. Este hecho pudo haberse reconocido a partir de la eliminación gaussiana, 
pero no fue así. E 


La solución de 
xi +3=0 
2x1 e Ax) = 6 
tiene O y 6 en la primera columna para x,, y en la segunda columna para x>: 











p 3 1.0 

6 4 —18 2 61| .6 

AS A A o A y mk 

AS NÓ NS =) 
2.4 Ds 











Los denominadores siempre son det A. Para 1000 ecuaciones, la regla de Cramer requiere 
1001 determinantes. Para mi consternación, encontré en un libro titulado Mathematics for 
the Millions que la regla de Cramer era realmente recomendada (y la eliminación se deja- 
ba de lado): 


Para tratar con un conjunto que implica cuatro variables u, w, z, primero es necesa- 
rio eliminar una de ellas en cada uno de los tres pares con la finalidad de obtener tres 
ecuaciones en tres variables y así proceder para el triple miembro izquierdo para ob- 
tener valores para dos de ellas. El lector que haga esto como ejercicio empezará a 
darse cuenta de cuán formidablemente laborioso se convierte el método de elimina- 
ción, donde es necesario tratar con más de tres variables. Esta consideración nos in- 
vita a explorar la posibilidad de un método más rápido ... 


¡El “método más rápido” es la regla de Cramer! Si el autor intentaba calcular 1001 de- 
terminantes, ¡yo llamaría al libro Mathematics for the Millionaire! 


3. El volumen de una caja. La relación entre el determinante y el volumen se vuelve más 
evidente cuando los ángulos son rectos: las aristas son perpendiculares, y la caja es rectangu- 
lar. Así, el volumen es el producto de las longitudes de las aristas: volumen = ff, -.-£.,,. 

Se desea obtener el mismo £;,£, - -- £, a partir de det A, cuando las aristas de esa ca- 
ja estén en los renglones de A. Con ángulos rectos, estos renglones son ortogonales y AA* 
es diagonal: 


renglón 1 
Caja con ángulos rectos 


mot 
Renglones ortogonales a 


renglón n 


o 3d Ogg 30” 
3 50 Om 30m 


e 
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Las £, son las longitudes de los renglones (las aristas), y los ceros fuera de la diagonal se 
deben a que los renglones son ortogonales. Usando las reglas del producto y de la traspo- 
sición, 


Caso con ángulos rectos £í£5---12 =det(AAT) = (det AXdet AP) = (det Ay. 


La raíz cuadrada de esta ecuación indica que el determinante es igual al volumen. El sig- 
no de det A indica si las aristas constituyen un conjunto “derecho” de coordenadas, como 
en el sistema x-y-z de costumbre, o un sistema izquierdo, como y-x-z. 

Si los ángulos no son de 907, entonces el volumen no es el producto de las longitudes. 
En el plano (véase la figura 4.2), el “volumen” de un paralelogramo es igual a la base £ 
multiplicada por la altura h. El vector b — p de longitud h es el segundo renglón b = (a»;, 
422), menos su proyección p sobre el primer renglón. La cuestión clave es ésta: Por la re- 
gla 5, det A permanece sin cambio cuando un múltiplo del renglón 1 se resta del renglón 2. 
El paralelogramo puede cambiar a un rectángulo, donde ya se ha demostrado que volu- 
men = determinante. 

En n dimensiones, se requiere más trabajo para hacer rectangular a cada caja, aunque 
la idea es la misma. El volumen y el determinante permanecen sin cambio si de cada ren- 
glón se resta su proyección sobre el espacio generado por los renglones precedentes, dejan- 
do un “vector longitud” perpendicular como pb. Este proceso de Gram-Schmidt produce 
renglones ortogonales, con volumen = determinante. Así, la misma desigualdad debe cum- 
plirse para los renglones originales. 








b= (4971, 092) 


4 (11, 412) 


longitud £ = |a| 


Figura 4.2 Volumen (área) del paralelogramo = £ veces h = Idet Al. 


Así se completa el vínculo entre los volúmenes y los determinantes, aunque merece la 
pena volver una vez más al caso más simple. Se sabe que 


1 0 E E ds DS 
det | a det p= 


Estos determinantes proporcionan los volúmenes, o las áreas, ya que se está trabajando en 
dos dimensiones, que se muestran en la figura 4.3. La base y la altura del paralelogramo 
miden uno; de modo que su área también es 1. 


4. Una fórmula para los pivotes. Finalmente ya es posible saber cuándo es posible 
realizar la eliminación sin intercambios de renglones. La observación clave es que los 
k primeros pivotes están determinados completamente por la submatriz A, en la esqui- 
na superior izquierda de A. Los renglones y las columnas restantes de Á no afectan esta 
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renglón 2 = (c, 1) 


renglón 2 = (0, 1) 


renglón 1 = (1,0) 





Figura 4.3 Las áreas de un cuadrado unitario y de un paralelogramo unitario son iguales a 1. 


esquina del problema: 


La eliminación a b e a b e 
sobre A incluye la A=jc d fl|=> 0 (ad-bofa (af —ecxMfal. 
eliminación sobre A, g hi 8 h i 


Ciertamente, el primer pivote sólo depende del primer renglón y de la primera columna. El se- 
gundo pivote (ad — bc)/a, sólo depende de la submatriz esquinada A, de 2 por 2. El resto de 
A no entra sino hasta el tercer pivote. En realidad, lo que determina la esquina superior izquier- 
da de L no sólo son los pivotes, sino todas las esquinas superiores izquierdas de £, D, y U: 


1 a 1 bla * 
A =LDU=|c/a 1 (ad — bo/a 1 x*]j. 
* 1 xk 1 


Lo que se ve en los dos primeros renglones y columnas es exactamente la factorización de 
la submatriz esquinada A». Esta es una regla general si no hay intercambios de renglones: 





La demostración es ver que esta esquina puede establecerse primero, incluso antes de consi- 
derar otras eliminaciones. O bien, se aplican las reglas para la multiplicación por bloques: 


E db o] [o E] - [LaDrds L¿D¿F ] 


LD = | A RN BD;U; BD;F +CEG 


Al comparar la última matriz con A, la esquina £,¿D,¿U, coincide con Az. Así, 
det Az = det L; det D, det U, = det D¿ = did»: + «dy. 


El producto de los k primeros pivotes es el determinante de Ay. Ésta es la misma regla que 
ya se conoce para toda matriz. Debido a que el determinante de A,., está dado por d,d> :- 
dy... 1, cada pivote d, puede aislarse como un cociente de determinantes: 
Fórmula para los pivotes E E o A de. (5) 
det Ag-1 dida «de-1 
En el ejemplo anterior, el segundo pivote era exactamente este cociente (ad — bo)/a. 
Es el determinante de A, dividido entre el determinante de A,. (Por convencionalismo, det 
Ao = 1, de modo que el primer pivote es a/l = a). 





BNIVERZ AR CEN. DBA. TACIONAL 


A A yo? a tb 


e, Le E 3 Aplicaciones de los determinantes 2285 
a co LA DEL URUGUAY 
O AE 


Al oca eútte síca todos los dd ifidividuales, se recupera 


det A; det A) det A, det Ar 
da E A AA AAA A AR E det A 
ce det Ay detA¡  detAn-  detAp 
Con base en la ecuación (5) es posible leer finalmente la respuesta de nuestra pregun- 
ta original: Todos los elementos pivote son diferentes de cero siempre que todos los nú- 


meros det A, sean diferentes de cero: 





Eso es lo concerniente a los determinantes, excepto por una observación opcional sobre la 
propiedad 2: el cambio de signo sobre los intercambios de renglones. El determinante de 
una matriz permutación P es el único punto cuestionable en la gran fórmula. Independien- 
temente de los intercambios particulares en los renglones que vinculan P con f, el número 
de intercambios ¿siempre es par o impar? De ser así, su determinante está bien definido por 
la regla 2, como +1 0 —1. 

Empezando con (3, 2, 1), con un simple intercambio de 3 y 1 podría llegarse al orden 
natural (1, 2, 3). Así sería también con un intercambio de 3 y 2, luego de 3 y 1, y después de 
2 y 1. En ambas secuencias, el número de intercambios es impar. La afirmación es que un níú- 
mero par de intercambios jamás puede producir el orden natural, empezando con (3, 2, 1). 

A continuación se proporciona una demostración. Considere cada par de números en 
la permutación, y sea N la cantidad de pares en que primero aparece el número mayor. Cier- 
tamente, N = O para el orden natural (1, 2, 3). El orden (3, 2, 1) tiene N = 3 porque todos 
los pares (3, 2), (3, 1), y (2, 1) son erróneos. Se demostrará que todo intercambio modifica 
a Ñ por un número impar. Luego, para llegar a N = 0 (el orden natural) se requiere un nú- 
mero de intercambios que tenga la misma característica par o impar que /N. 

Cuando se intercambian vecinos, N cambia por +1 o —1. Cualquier intercambio pue- 
de lograrse mediante un número impar de intercambios de vecinos. Esto completa la de- 
mostración; un número impar de números impares es impar. Para intercambiar los 
elementos primero y cuarto a continuación, que son 2 y 3, se requieren cinco intercambios 
(un número impar) de vecinos: 


(2,1,4,3) > (1,2,4,3) > (1, 4, 2,3) > (1, 4,3, 2) > (1, 3, 4, 2) — (3, 1, 4, 2). 


Se requieren £ — k intercambios de vecinos para mover el elemento que está en el lugar k 
al lugar £. Luego, £ — k — 1 intercambios mueven al elemento que originalmente estaba 
en el sitio £ (y que ahora se encuentra en el lugar £ — 1) de regreso al lugar k. Debido a 
que (£ — k) + (£ — k— 1) es impar, se ha completado la demostración. El determinante 
no sólo tiene todas las propiedades antes encontradas, incluso existe. 





Conjunto de problemas 4.4 


1. Encuentre el determinante y todos los nueve cofactores C;, de la siguiente matriz trian- 


lar: 
E 1.23 
+= A E O 
DOES $ 


Escriba CT, y compruebe que ACT = (det A). ¿Qué es A7?*? 


BEA 
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2 


mm ad 
¿her oe 
EAN ASA 


Use la matriz de cofactores C para invertir las siguientes matrices simétricas: 


2-1 0 DAA 
A=|-1 2 -1 y B=|1 2 2 
0-1 2 E 


Encuentre x, y, y z aplicando la regla de Cramer en la ecuación (4): 


x+4y- z=1 
ax +by=1 ó 


x+ y+ z=0 
cx +dy=0 A d 


2x + 3z =0. 


a) Encuentre el determinante cuando un vector x sustituye a la columna f de la identi- 
dad (considere x, = O como un caso por separado): 


si M= xj entonces det M =___ 


b) Si Ax = b, demuestre que AM es la matriz B, en la ecuación (4), con b en la colum- 
na ¿. 

c) Deduzca la regla de Cramer, tomando determinantes en AM = B). 

a) Dibuje el triángulo con vértices A = (2, 2), B = (— 1, 3), y C = (0, 0). Al conside- 
rarlo como la mitad de un paralelogramo, explique por qué su área es igual a 


iS 
b) Mueva el tercer vértice a C = (1, —4) y justifique la fórmula 


área (ABC) = > det | Z 3. 


área (ABC) = y det Xx ya 1| = 3 det =1 3 1 
x3 y3 1 l —4 1 
Sugerencia: Al restar el último renglón de cada uno de los demás se obtiene 
2 206 | 1 6 0 1 6 
det. 1 3 1j =det1-2 7 0]| =det de A 
1 — 1 1 —4 1 


Trace A* = (1,6), B" =(-2,7), C* = (0, 0) y su relación con A, B, C. 


Explique en términos de volúmenes por qué det 34 = 3” det A para cualquier matriz 
A de n por n. 


Pronostique, y confirme por eliminación, los elementos pivotes de 





2 M2 zo AZ 
A=14 353 O y B=j|j4 35 3 
PES ES, 2 O 
Encuentre todas las permutaciones impares de los números (1, 2, 3, 4]. Provienen de 
un número impar de intercambios y conduce a det P = —1, 


Suponga que la permutación P lleva (1, 2, 3, 4, 5) a (5, 4, 1, 2, 3). 
a) ¿Qué hace Pa (1, 2, 3, 4, 5)? 
b) ¿Qué hace P7* a(1, 2, 3, 4, 5)? 


ei O A : , 

A a e A . , as , 
O ON OS TT II E 
TIA ñ ' . , 

plane Hp57 101 9 A PUR TACA A UIC A . ñ 
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10. Si P es una permutación impar, explique por qué P? es par pero P7? es impar. 


M1. Demuestre que si se mantiene la multiplicación de A por la misma matriz permuta- 
ción P, entonces el primcr renglón termina por regresar a su sitio original. 


12. SiA es una matriz de 5 por 3 con todos la,¡| = 1, entonces det A <= . Los volú- 
menes, la gran fórmula o los pivotes deben proporcionar alguna cota superior para 
el determinante. 


Los problemas 13 al 17 son sobre la regla de Cramer para x = A7*b, 


13. Resuelva las siguientes ecuaciones lineales, aplicando la regla de Cramer x, = det 
B,/det A: 


2 Xz2 =]1 

2 3x3 = ] 
ad > b) MITE ZA x =0 

Xx X= 
: % xa +2x3 =0. 


14. Use la regla de Cramer para despejar (solamente) y. Sea D el determinante de 3 por 3: 
ax +by+cz=1l 
by dx+ey+fz=0 
gx +hy+ iz=0,. 
15. La regla de Cramer falla cuando det A = O. El ejemplo a) no tiene solución, mientras 
b) tiene una infinidad. ¿Cuáles son los cocientes x, = det B, /det A? 


O (rectas paralelas) b) O (a mis ecta) 
rec a a misma r 
4x1 + 6x7 =1. d dx, + 6x2, =2 
16. Demostración rápida de la regla de Cramer. El determinante es una función lineal de la 
columna 1. Es cero si dos columnas son iguales. Cuando b = Ax = xa] + x247 + 
x343 va en la columna 1 para producir B,, el determinante es 


ax +by=1 
cx + dy =0. 


y a as| = [xa + x342 + x343 4 as| = xa; 42 as| = 1, det A. 


a) ¿Qué fórmula para x, proviene de miembro izquierdo = miembro derecho? 
b) ¿Qué pasos llevan a la ecuación de en medio? 


17. Si el miembro derecho b es la última columna de A, resuelva el sistema Ax = b de 3 por 
3. Explique cómo cada determinante en la regla de Cramer conduce a su solución x. 


Los problemas 18 a 26 son sobre A7* = C*/det A. Recuerde trasponer C. 


18. Encuentre A”! a partir de la fórmula de cofactores C*/det A. Use simetría en el inci- 
so b): 


PRZ O o 2, 
a A=|0 3 0]. by A=|i1 2 -1 
Did EL IS 


19. Si todos los cofactores son cero, ¿cómo se sabe que A no tiene inversa? Si ninguno de 
los cofactores es cero, ¿es seguro que Á es invertible? 


20. Encuentre los cofactores de A, y multiplique AC* para encontrar det A: 


1 1 4 e E E 
7 EA C=|. E y aC f=_ 
A 


Si el elemento de la esquina se cambia de 4 a 100, ¿por qué det A permanece sin cam- 
bio? 
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21. Suponga que det A = 1 y que se conocen todos los cofactores. ¿Cómo puede encon- 
trarse A? 


22. A partir de la fórmula AC* = (det A)/, demuestre que det C = (det Ay” ?. 


23. (Sólo para profesores) Si se conocen todos los 16 cofactores de una matriz invertible 
A de 4 por 4, ¿cómo encontrar 4? 


24. Si todos los elementos de A son enteros, y det A = 1 o —1, demuestre que todos los 
elementos de A” * son enteros. Proporcione un ejemplo de 2 por 2. 


25. Les triangular inferior y $ es simétrica. Suponga que son invertibles: 
a 0 0 ano a 
E=.b 6.0 S=lb cc e 
NS E dae E 


a) ¿Cuáles son los tres cofactores de L que son cero? Entonces L”* es triangular infe- 
rior. 

b) ¿Cuáles son los tres pares de cofactores de S que son iguales? Entonces S”! es si- 
métrica, 

cofactores y cada cofactor de 4 por 4 contiene 

multiplicaciones. Compare con 5? = 125 


26. Para n= 5, la matriz C contiene 
términos y cada término requiere 
para el cálculo de Gauss-Jordan de A” ?. 








Los problemas 27 a 36 son sobre área y volumen por determinantes. 


27. a) Encuentre el área del paralelogramo con aristas v = (3, 2) y w = (l, 4). 
b) Encuentre el área del triángulo con lados v, w, y v + w. Dibújelo. 
c) Encuentre el área del triángulo con lados v, w, y w — v. Dibújelo. 


23. Las aristas de una caja van de (0, 0, 0) a (3, 1, 1), (1, 3, 1), y (1, 1, 3). Encuentre su 
volumen y también el área de cada cara del paralelogramo. 


29. a) Los vértices de un triángulo son (2, 1), (3, 4), y (0, 5). ¿Cuál es el área? 


b) Un nuevo vértice en (— 1, 0) lo hace de lobular (cuatro lados). Encuentre el área. 


30. El paralelogramo con lados (2, 1) y (2, 3) tiene la misma área que el paralelogramo 
con lados (2, 2) y (1, 3). Encuentre estas áreas a partir de determinantes de 2 por 2, y 
justifique por qué deben ser iguales. (No puedo verlo en una ilustración. Por favor es- 
críbame si usted puede verlo.) 


31. La matriz H de Hadamard tiene renglones ortogonales. ¡La caja es un hipercubo! 


1 1 1 1 
1 o 
1 | 1 
1 Lol 





¿Qué es det AH = = volumen de un hipercubo en R*? 


32. Si las longitudes de las columnas de una matriz de 4 por 4 son L,, L;, Ly, La, ¿cuál es 
el máximo valor posible para el determinante (con base en el volumen)? Si todos los 
elementos son 1 o —1, ¿cuáles son esas longitudes y el determinante máximo? 


33. Demuestre con una figura cómo un rectángulo con área x, y, menos un rectángulo con 
área xy, produce el área xy — x2y, de un paralelogramo. 


34. Cuando los vectores arista a, b, c son perpendiculares, el volumen de la caja es lla|| por 
bl] por Jlel|. La matriz ATA es . Encuentre det ATA y det A. 
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33. ¿Cuántos vértices tiene un cubo r-dimensional? ¿Cuántas aristas? ¿Cuántas caras n — 1 
dimensionales? El n-cubo cuyas aristas son los renglones de 27 tiene volumen ___. 
Una computadora hipercúbica tiene procesadores en paralelo en los vértices, con co- 
nexiones a lo largo de las aristas. 


36. El área de un triángulo con vértices (0, 0), (1, 0), (0, 1) es 2. El volumen de la pirámi- 
de con cuatro vértices (0, 0, 0), (1, 0, 0), (0, 1,0), (0,0, l) es . ¿Cuál es el volu- 
men de la pirámide en R* con cinco vértices en (0, O, O, 0) y los renglones de 7? 





Los problemas 37 a 40 son sobre áreas dA y volúmenes dV, en cálculo. 


37. Las coordenadas polares satisfacen x = rcos 8 y y = rsen 6. El área polar J dr d8 in- 
cluye a y: 


cosó —rsenó 
sen9  rcosOi' 


Así, ] = 


pe 9x/9r E 


dy/dr 9y/98 











Las dos columnas son ortogonales. Sus longitudes son 





38. Las coordenadas esféricas po, $, O proporcionan x = p sen $ cos 9, y = p sen q sen 0, 
z = pcos q. Encuentre la matriz jacobiana de 9 derivadas parciales: 3x/9p,0x/09%H, 
9x/90 están en el renglón 1. Simplifique su determinante a J = p? sen y. Luego, 
dV = p? sen $ do de db. 

39. La matriz que relaciona r, 9 con x, y y está en el problema 37. Invierta esa matriz: 

dr/dx 9r/dy 

00/0dx 20/9y 


cosó ? 
y de 


. 
— 


IS ==? 














Es sorprendente que 9r/0x = dx/0r. El producto J.J”* = 7 proporciona la regla de la 





cadena 
dx _ dx Or A o08 ÓN 
Ox dróx 00 09x 
40. El área del triángulo con vértices (0, 0), (6, 0), y (1, 4) es , Cuando se hace rotar 
un ángulo 0 = 60", el área es . La matriz rotación tiene 





cosó —senó 
sen9  cosó 


1 
determinante = s 














41. Sean P = (1,0, -D,0= (1,1,D,yR = (, 2, 1). Escoja S de modo que PORS sea 
un paralelogramo, y calcule su área. Escoja 7, U, V de modo que OPORSTUV sea una 
caja inclinada, y calcule su volumen. 


42. Suponga que (x, y, 2), (1, 1, 0), y (1, 2, 1) están en un plano que pasa por el origen. 
¿Cuál determinante es cero? ¿Qué ecuación proporciona esto para el plano? 


43. Suponga que (x, y, z) es una combinación lineal de (2, 3, 1) y (1, 2, 3). ¿Cuál determi- 
nante es cero? ¿Qué ecuación proporciona esto para el plano de todas las combinacio- 
nes? 


44. SiAx= (1,0,..., 0), demuestre que la regla de Cramer proporciona x = primera co- 
lumna de A7?. 

45. (VISA a AVIS) Esto requiere un número impar de intercambios (IVSA, AVSL AVIS). 
Cuente los pares de letras en VISA y AVIS que están invertidas en orden alfabético. 
La diferencia debe ser impar. 
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Ejercicios de repaso 


4.1 Encuentre los determinantes de 


LO A ae 20621 
0 o a A 
E e JE y 0e= 22 =1 
e: A e 


4.2 SiB = MT'AM, ¿por qué es cierto que det B = det A? También demuestre que det 
AUB=1. 


4.3 Empezando con A, multiplique su primer renglón por 3 para obtener B, y reste el pri- 
mer renglón de B del segundo para obtener C. ¿Cómo está relacionado det C con det 
A? 


4.4  Resuelva 3u + 2v = 7, 4u + 3v = 11, aplicando la regla de Cramer. 


4.5 Si todos los elementos de A y A”* son enteros, ¿cómo sabe que ambos determinantes 
son 10 —1? Sugerencia: ¿A qué es igual det A multiplicado por det A”*? 


4.6 Encuentre todos los cofactores, y la inversa o el espacio nulo, de 
DO coso —senó a b 
69 seng  cosg|! % la b|' 
4.7 ¿Cuál es el volumen del paralelepípedo que tiene cuatro de sus vértices en (0, O, 0), 
(-1,2,2), (2, —1, 2), y (2, 2, 1)? ¿Dónde están los otros cuatro vértices? 


4.8 ¿Cuántos términos hay en el desarrollo de un determinante de $5 por 3, y cuántos de 
éstos es seguro que son cero si 47, = 0? 


4.9 Si P, es una matriz permutación par y P, es impar, a partir de P, + Pa, = 
P(P,T + P,T) P, deduzca que det (P, + P,) = 0. 


4.10 Si det A > O, demuestre que A puede conectarse a / mediante una Cadena continua de 
matrices A(£), todas con determinantes positivos. (La ruta directa A(S) = A + t(l — A) 
va de A(0) = A aA(1) = Í, pero entretanto A(£f) puede ser singular. El problema no es 
tan sencillo, y el autor agradecerá las soluciones que le sean enviadas.) 


4.11 Explique por qué el punto (x, y) está sobre la recta que pasa por (2, 8) y (4, 7), si 


A O 
det|2 8 1]| =0, obien x+2y-—18=0,. 
4 q 


4.12 En analogía con el ejercicio previo, ¿cuál es la ecuación para que (x, y, z) esté sobre 
el plano que pasa por (2, 0, 0), (0, 2, 0) y (0, O, 4)? Implica un determinante de 4 por 
4. 


4.13 Si los puntos (x, y, 2), (2, 1, 0), y (1, 1, 1) están sobre un plano que pasa por el ori- 
gen, ¿qué determinante es cero? Los vectores (1, 0, —1), (2, 1, 0), (1, 1, 1), ¿son in- 
dependientes? 


4.14 Si todo renglón de A tiene un solo +1, o un solo —1, o uno de cada uno (y en caso 
contrario es cero), demuestre que det A = lo —100. 





O 
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4.15 S1 C = [: 2] y D= E a , entonces CD = — DC produce 4 ecuaciones Ax = 0: 


2a c b 0 u 0 
_ b ar+rd 0 b 3 A 1, 
CDF: DE =0 es ee 0 E a 
0 E b 2d Z 0 
(a) Demuestre que det A = O si a + d = O. Resuelva para u, v, w, z, los elementos 
de D. 
b) Demuestre que det A = O si ad = bc (de modo que C es singular). 
En todos los demás casos, CD = —DC sólo es posible con D = matriz cero. 
4.16 El desplazamiento circular permuta (1, 2,...,n)en(2,3,..., 1). ¿Cuál es la matriz 


permutación correspondiente P, y (dependiendo de n), cuál es su determinante? 


4.17 Encuentre el determinante de A = eye(5) + ones(5) y si es posible, el de 
eye(n) + onesín). 
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Capítulo 








Valores caracter sticos y 
vectores característicos 


5.1 INTRODUCCIÓN 


Este capítulo inicia la “segunda parte” del álgebra lineal. La primera mitad concernía a 
Ax = b, El nuevo problema, Ax = Ax, se resolverá simplificando una matriz, haciéndola 
diagonal de ser posible. El paso fundamental es ya no restar un múltiplo de un renglón de 
otro. La eliminación modifica los valores característicos, lo cual no es deseable. 

Los determinantes proporcionan una transición de Ax = ba Ax = Ax. En ambos ca- 
sos el determinante lleva a una “solución formal”: para la regla de Cramer para x = A7!b, 
y para el polinomio det (4 — A/.) cuyas raíces son los valores característicos. (Ahora todas 
las matrices son cuadradas; los valores característicos de una matriz rectangular no tienen 
más sentido que su determinante.) El determinante puede usarse realmente sin = 2 0 3. 
Para n grande, el cálculo de A es más difícil que resolver Ax = b, 

El primer paso es comprender la manera en que los valores característicos pueden ser 
de utilidad. Una de las aplicaciones de éstos es en las ecuaciones diferenciales. ¡Aquí se 
supone que el lector no es un experto en ecuaciones diferenciales! Si el lector puede di- 
ferenciar x”, sen x, y e”, sabe lo suficiente. Como ejemplo específico, considere el par de 
ecuaciones acopladas 


A v=8 en ¿=0, 

di 

, (1) 
e II) wWx=5 en ¿=0. 

dt 


Este es un problema con valor inicial. La incógnita se especifica en el instante £ = O, me- 
diante los valores iniciales proporcionados 8 y 5. El problema consiste en encontrar v(t) y 
w(t) para instantes posteriores t > O. 

Resulta fácil escribir el sisterma en forma matricial. Sea u(t) el vector que se descono- 
ce, con valor inicial u(0). La matriz de coeficientes es A: 


Vector desconocido u(t) = dsd u(0) = Bl A = B dE L 


Las dos ecuaciones acopladas se convierten en la ecuación vectorial que se busca; 









Forma matricial S — = Au Ao a e E - 10) e en E = = 0. (2) 


és srta 
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Este es el planteamiento básico del problema. Observe que se trata de una ecuación de pri- 
mer orden; no aparecen derivadas de orden superior, y es lineal en las incógnitas. También 
tiene coeficientes constantes, la matriz A es independiente del tiempo. 

¿Cómo se encuentra u(£)? Si en vez de una sola incógnita hubieran dos, sería fácil con- 
testar esta pregunta. En lugar de una ecuación escalar se tendría una ecuación vectorial: 


=au con u =u(0) en t =0. 6) 


Ecuación simple a 


Basta conocer la solución de esta ecuación: 


Exponencial pura — u(t) = e*u(0). (0 


En el instante inicial £ = O, ues igual a u(0) porque e” = 1. La derivada de e” tiene el fac- 
tor requerido a, de modo que du/di = au. De esta forma se satisfacen tanto la condición 
inicial como la ecuación. 

Observe el comportamiento de u para grandes instantes. La ecuación es inestable si 
a > 0, neutralmente estable si a = O, o estable si a < 0; el factor e”* tiende al infinito, per- 
manece acotado o tiende a cero. Si a fuese un número complejo, a = e + ¿B, entonces las 
mismas pruebas podrían aplicarse a la parte real «. La parte compleja produce oscilaciones 
e*P! = cos Bt + i sen Bt. La disminución o el crecimiento están regidos por el factor e”. 

Tanto para una simple ecuación. Se asumirá un método directo a sistemas, y se busca- 
rán soluciones con la misma dependencia exponencial sobre t justo para encontrar en el ca- 





so escalar: 
v(t) = e" y 
Pa 6) 
w(t) = ez 
o, en notación vectorial, 
ut =e"x: (6) 


Esta es toda la clave para las ecuaciones diferenciales du/dt = Au: buscar soluciones ex- 
ponenciales puras. Al sustituir v = e y w = e*z en la ecuación, se encuentra 


de" y = 48 y — 50 z 
dez =2e "y — 30% z, 


El factor e** es común a cada término, por lo que puede eliminarse. Esta cancelación es la 
razón por la cual para ambas incógnitas se supone el mismo exponente A; así se queda con 





A AAA Dee 

E US A 

, $ AS 
ILEANA E 


PA A (7) 











Problema de valor característico 





Esta es la ecuación con valor característico. En forma matricial, se trata de Ax = Ax. Pue- 
de verla de nuevo si se utiliza u = e*x: un número e** que crece o disminuye multiplicado 
por un vector fijo x. Al sustituir en duldt = Au se obtiene 1e“x = Ae*x. Al cancelar e** 


se obiiene 


Ecuación de valor característico A == (8) 


1 a 
$ A A ÓN 
PoR TA RI PROS 7 or RR ONE DONA DA 0 LON A A A a AOS 
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Ahora se cuenta con la ecuación fundamental de este capítulo. Implica dos incógnitas, 
A y x. Se trata de un problema algebraico, ¡por lo que es posible olvidarse de las ecuacio- 
nes diferenciales! El número 4. (lambda) es un valor característico de la matriz A, y el vec- 
tor x es el vector característico asociado. Nuestro objetivo es encontrar los valores 
característicos y los vectores característicos, las As y las xs, y utilizarlas. 


Las soluciones de Ax = Ax 


Observe que Ax = Ax es una ecuación no lineal; A multiplica a x. Si fuese posible encon- 
trar A, entonces la ecuación para x sería lineal. De hecho, en lugar de Ax podría escribirse 
Alx, y pasar este término al miembro izquierdo: 


ALDO o) 


La matriz identidad preserva matrices y preserva rectos a los vectores; la ecuación (4 — 
Ax = O es más corta, pero está mezclada. Esta es la clave del problema: 


El vector x está en el espacio nulo de A — Y. 


El número d se escoge de modo que A — A tenga un espacio nulo. 





Por supuesto, toda matriz tiene un espacio nulo. Resultaría ridículo sugerir lo contrario, pe- 
ro el lector puede darse cuenta de este asunto. Se busca un vector característico x distinto 
de cero. El vector x = O siempre satisface Ax = Ax, aunque resulta inútil para resolver ecua- 
ciones diferenciales. El objetivo es construir u(t) sin exponenciales ex, y se está interesa- 
do sólo en aquellos valores particulares ) para los que exista un vector característico x 
distinto de cero. Para que sea útil, el espacio nulo de A — A7 debe contener vectores dife- 
rentes de cero. En breve, A — Al debe ser singular. 
Para el efecto, el determinante proporciona una prueba concluyente. 










Pa a ; A ¿sl 





;Obiem,: Ax =Ax, 
En nuestro ejemplo, A se sustituye por AÍ para hacerla singular: 
á— A 9 
R —1I = 
estar Al A —Al | > AN 
Observe que A sólo se resta de la diagonal principal (ya que multiplica a £). 


Determinante  |A—A1|=(4-—AX-3-A)+10 o A4—A-—2. 


Este es el polinomio característico. Sus raíces, donde el determinante es cero, son los va- 
lores característicos. Éstos provienen de la fórmula general para encontrar las raíces de una 
cuadrática, o de la factorización de 12? — 1—2=(2 + DQ — 2). Esto es cerosid = —1 
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04 = 2, lo cual se confirma con la fórmula general: 


—b+vYb?i=dace 1+v40 


Valores característicos A == AAAAA«>4——] = ANXÁ =— 1 y 2. 


; 
| 


Hay dos valores característicos, porque una cuadrática tiene dos raíces. Toda matriz 
de 2 por 2 A — A tiene a A* (y ninguna otra potencia superior de 1) en su determinante. 

Los valores A = —1 yA = 2 llevan a la solución de Ax = Ax o (4 — Ax = 0. Una 
matriz con determinante igual a cero es singular, por lo que en su espacio nulo debe haber 
vectores x diferentes de cero. De hecho, el espacio nulo contiene toda una recta de vecto- 
res característicos; ¡es un subespacio! 


PLE a 0 o yl A 
A] = ES (A Dx = [3 eS B lo) 


La solución (el primer vector característico) es cualquier múltiplo diferente de cero de x;: 


PA IAE PESA a 4 AR DRA Pa III E AI IICA ICM DO A SUCIO RIRS RAY 


Vector característico para 44 xi = F | 


El cálculo de A, se realiza por separado: 


Er q ES A e a TO, 
Az =2: (A AaDx = E al 4 = ol: 


El segundo vector característico es cualquier múltiplo diferente de cero de x,: 


Vector característico para A,  x, = 2 


FIPENTOMENN SPA IBAN CARA ATNPOATAIIRACOAN A APOOLOREI O  ICRARRLAART eoe 


Quizá el lector observe que las columnas de A — Af proporcionan x», y que las columnas 
de A — A2í son múltiplos de x,. Este hecho es especial (y útil) para las matrices de 2 por 2. 

En el caso de 3 por 3, a menudo igualo una componente de x a 1, y resuelvo (4 — Ax 
= 0 para las otras componentes. Por supuesto, si x es un vector característico, entonces 
también lo son 7x y —x. Todos los vectores en el espacio nulo de A — A/ (que se conoce 
como espacio característico) cumplen Ax = Ax. En nuestro ejemplo, los espacios caracte- 
rísticos son las rectas que pasan por x, = (1, 1) y x, = (5, 2). 

Antes de volver a la aplicación (la ecuación diferencial), se recalcan los pasos para re- | 
solver Ax = Ax: i 


O AA 


1. Calcular el determinante de A — MM. Una vez que A se ha restado de la diagonal prin- 
cipal, este determinante es un polinomio de grado n. Comienza con (—A)”. 

2. Encontrar las raíces de este polinomio. Las n raíces son los valores característicos 
de A. 

3. Para cada valor característico, resolver la ecuación (A — ADx = 0. Debido a que el 
determinante es cero, hay otras soluciones distintas de x = O. Se trata de los vectores 
característicos. 


LOS DEERE NAURU e 


En la ecuación diferencial, lo anterior produce las soluciones especiales u = e*x. Se trata 
de las soluciones puramente exponenciales de du/di = Au. Observe a e”* y e”. 


ANA ¿ACE IMAACOI +2 NDA TIRA PIPE NIPONA, DORIA 1 pla go A AS AN 


ES o A y u(t) = ex, = e* el 


A TS 


SR 


fo 
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Estas dos soluciones especiales proporcionan la solución completa. Pueden multiplicarse 
por números cualesquiera c, y cz, y pueden sumarse entre sí. Cuando u, y u, satisfacen la 
ecuación lineal du/d: = Au, también lo hace su suma uy + u): 


Solución completa — u(t) =cie*"x, + 070 x, (12) 


Este hecho se denomina superposición, y es válido para las ecuaciones diferenciales (ho- 
mogéneas y lineales) justo como era válido para ecuaciones matriciales Ax = O, El espacio 
nulo siempre es un subespacio, y las combinaciones de las soluciones siguen siendo solu- 


ciones. 
Ahora se tienen dos parámetros libres c, y c», y es razonable esperar que sea posible 
de modo que cumplan la condición inicial u = u(0) en 1 = 0: 


Condición inicial C¡X1 + C2x2 = u(O) O bien h a a = El as) 


Las constantes son Cc, = 3 y c, = 1, y la solución de la ecuación original es 
uo 30 [e as 


Cuando las dos componentes se escriben por separado, se tiene v(0) = 8 y w(0) = 5; 


Solución v(1) =3e " + 5e?, w(t) = 3e" +2e*, 


La clave se encontraba en los valores característicos Á y en los vectores característi- 10 


cos x. Los valores característicos son importantes de suyo, y no sólo son parte de un truco 
para encontrar u. Quizá el ejemplo más conocido es el de los soldados marchando sobre un 
puente.” Tradicionalmente, dejan de marchar y simplemente caminan sobre el puente. Si 
ocurre que caminan a una frecuencia igual a uno de los valores característicos del puente, 
entonces éste comienza a oscilar. (Del mismo modo en que lo hace un columpio infantil; 
pronto se percibe la frecuencia natural de un giro, e igualándola se hace más grande la os- 
cilación). Un ingeniero intenta que las frecuencias naturales de su puente o nave espacial 
estén alejadas de las frecuencias del viento o del movimiento del combustible. Y en el otro 
extremo, un corredor de bolsa pasa su vida intentando estar en línea con las frecuencias na- 
turales del mercado. Los valores característicos constituyen el rasgo más importante de 
prácticamente cualquier sistema dinámico. 


Resumen y ejemplos 


Para resumir, en esta introducción se ha mostrado cómo A y x aparecen de forma natural y 
espontánea cuando se resuelve du/dt = Au, Esta ecuación posee soluciones puramente ex- 
ponenciales u = e*x; el valor característico proporciona la razón de crecimiento o disminu- 
ción, y el vector característico x se desarrolla a esta razón. Las otras soluciones son mezclas 
de estas soluciones puras, y la mezcla se ajusta para cumplir las condiciones iniciales. 

La ecuación clave era Ax = Ax. La mayor parte de los vectores no satisfacen esta ecua- 
ción. Cambian de dirección cuando se multiplican por A, de modo que Ax no es múltiplo 
de x. Esto significa que sólo ciertos números especiales 1 son valores característicos, y 
sólo ciertos vectores especiales x son vectores característicos. Es posible observar el com- 


"Ejemplo en el que nunca creí, aunque un puente se cayó de esta forma en 1831. 


isos 
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Ejemplo 1 


Ejemplo 2 


Ejemplo 3 


portamiento de cada vector característico, y luego combinar estos “modos normales” para 
encontrar la solución. En otras palabras, es posible diagonalizar la matriz subyacente. 

La diagonalización de la sección 5.2 se aplicará a ecuaciones en diferencias, a los nú- 
meros de Fibonacci, y a los procesos de Markov, así como a las ecuaciones diferenciales. 
En cada ejemplo se comenzará con el cálculo de los valores característicos y los vectores 
característicos; no existe ningún atajo para evitar esto. Las matrices simétricas son espe- 
cialmente fáciles. Las “matrices defectuosas” carecen de un conjunto completo de vecto- 
res característicos, por lo que no son diagonalizables. Ciertamente, es necesario analizarlas, 
aunque no se les permitirá su ingreso en el libro. 

Se empleza con ejemplos de matrices especialmente bondadosas. 


Todo resulta evidente cuando A es una matriz diagonalizable: 
SS l 0 
Á = P 4] tiene 11¡=3 con x,= o , 4A2=2 con x= Hl 


Sobre cada vector característico, A actúa como un múltiplo de la identidad: Ax, = 3x, y 
Ax, = 2x2. Otros vectores como x = (1, 5) son mezclas de x,+ 3x, de los dos vectores ca- 
racterísticos, y cuando A multiplica a x, y x», se Obtienen los valores característicos 1, = 
3 Y Az = 2: 


A multiplicada por xi +53x2 es 3x¡ +10x, = ol 


Esto es Ax para un vector típico x, no para un vector característico. Sin embargo, la acción 
de A es determinada por sus vectores característicos y valores característicos: 


¡Los valores característicos de una matriz proyección son l o 0! 


Pa 

P= E 1 tiene A¡=1 con x= Hl A2=0 con x= Dad 
qe a 

Cuando x se proyecta sobre sí mismo, se tiene A = 1, y cuando x se proyecta sobre el vec- 

tor cero se tiene A = 0. El espacio columna de P está lleno de vectores característicos, así 

como el espacio nulo. Si las dimensiones de estos espacios son r y n — r, respectivamen- 


te, entonces A = 1 se repite r veces y A = O se repite n — r veces (siempre n As): 


ESOO 70 
Cuatro valores 
a GO =0--0..0 , 
característicos que Pp= 000.0 tiene A =1,1,0,0. 
permiten repeticiones 0001 


No hay nada excepcional sobre 1 = 0. Así como cualquier otro número, el cero po- 
dría o no ser un valor característico. En caso de serlo, entonces sus vectores característicos 
satisfacen Ax = Ox. Así, x está en el espacio nulo de A. Un valor característico cero indica 
que A es singular (no invertible); su determinante es cero. Todas las matrices invertibles 
cumplen A % O, 


Cuando A es triangular, los valores característicos están sobre la diagonal principal. 
NA 4 S 


d(A-1D=| 0 ¿A 6 |=(1-1(í—1)(2—A). 
0 Di AA 
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El determinante es justo el producto de los elementos en la diagonal. Es cero si = 1, 
ES z DA = 5 ; los valores característicos ya estaban en la diagonal principal. 


Este ejemplo, donde los valores característicos pueden encontrarse por inspección, 
apunta a otro tema fundamental del capítulo: la transformación de A en una matriz diagonal 
o triangular sin cambiar sus valores característicos. Una vez más se recalca que la factori- 
zación gaussiana A = LU no es adecuada para este propósito. Los valores característicos de 
U pueden ser visibles en la diagonal, pero no son los valores característicos de A. 

Para la mayor parte de las matrices, no hay duda de que el problema de los valores ca- 
racterísticos es computacionalmente más difícil que Ax = bh. Con sistemas lineales, un nú- 
mero finito de pasos de eliminación producía la respuesta exacta en un tiempo finito. (O, 
de manera equivalente, con la regla de Cramer se obtenía una fórmula exacta para la solu- 
ción). Ninguna fórmula es capaz de proporcionar los valores característicos, o Galois Se re- 
volvería en su tumba. Para una matriz de 5 por 5, det (4 — AL) implica A”. Galois y Abel 
demostraron que no puede haber ninguna fórmula algebraica para encontrar las raíces de 
un polinomio de quinto grado. 

Todo lo que éstos permiten son algunas verificaciones sencillas de sus valores caracte- 
rísticos, después que se han calculado, y se mencionan dos buenos: la suma y el ad 


» AS TE 







en he a 
a Traza de 









A= + +=: Ay baii 





* Además, al produeto de los n valores característicos esi igual. al determinante de A. | me 


La matriz proyección P tiene elementos en la diagonal 3, 3 y valores característicos 1, 0 
Así, 3+ 3 coincide con 1+ 0, como debe ser. Así también lo hace el determinante, que es 
O - 1 =0. Una matriz singular, con determinante cero, tiene uno o más de sus valores ca- 
racterísticos igual a cero. 

No debe haber confusión entre los elementos en la diagonal y los valores característicos. 
Para una matriz triangular siempre son iguales, aunque este hecho es excepcional. Normal- 
mente los pivotes, los elementos en la diagonal, y los valores característicos son completa- 
mente distintos. Y para una matriz de 2 por 2, la traza y el determinante lo dicen todo: 


E A tiene traza a + d, y determinante ad — bc 


detíA — AL) = det = 1 — (traza)A + determinante 





ak b | 


traza + [(traza)? — 4 det]"? 
> : 


La suma de estos dos As es igual a la traza; en el ejercicio 9 se proporciona >_A; = traza 
para todas las matrices. 


Los valores característicos son A = 


Eigshow 


Hay un programa de demostración MATLAB (simplemente hay que teclear eigshow), que 
despliega el problema del valor característico para una matriz de 2 por 2. Empieza con el 
vector unitario x = (1, 0). El mouse hace que este vector se desplace alrededor de la circun- 
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ferencia unitaria. Al mismo tiempo, la pantalla muestra a Ax, a color y también en movi- 
miento. Posiblemente Ax esté enfrente de x. Posiblemente Ax esté detrás de x. Algunas ve- 
ces Ax es paralelo a x. En ese instante paralelo, Ax = Ax (dos veces en la segunda figura). 





a 03. 03 
y =(0,1) E A AA 
= 05 N 
9.3,0,7) pos | 
y 1 
> y Axs 
Ar =1(0:8,0:2) ad 





> Y 





ED) circunferencia de x's 


El valor característico A es la longitud de Ax, cuando el vector característico unitario 


x es paralelo. Las opciones integradas para A, ilustran tres posibilidades: 0, 1, o 2 para vec- 
tores característicos reales. 


2, 


No hay vectores característicos reales. Ax permanece atrás o adelante de x. Esto sig- 
nifica que los valores característicos y los vectores característicos, son complejos, co- 
mo lo son para la rotación OQ. 

Hay sólo una recta de vectores característicos (lo cual es inusual). Las direcciones 
cambiantes Ax y x se encuentran pero no se cortan. Este hecho ocurre para la siguien- 
te matriz de 2 por 2. 

Hay vectores característicos en dos direcciones independientes. ¡Este hecho es típico! 
Ax corta a x en el primer vector característico x,, y corta en el segundo vector carac- 
terístico x2. 


Suponga que A es singular (de rango 1). Su espacio columna es una recta. El vector 


Ax debe permanecer en esa recta mientras x gira alrededor. Un vector característico x está 
a lo largo de la recta. Otro vector característico aparece cuando Ax, = 0. Cero es un valor 
característico de una matriz singular. 


Para estas seis matrices, es posible seguir mentalmente a x y a Ax. ¿Cuántos vectores 


característicos hay, y dónde? ¿Cuándo ocurre que Ax se desplaza en el sentido del movi- 
miento de las manecillas del reloj, en vez de hacerlo en sentido contrario a las manecillas 


del reloj con x? 





*“icb3:J2£36363 


EE Conjunto de problemas 5.1 


1. 


Encuentre los valores característicos y los vectores característicos de la matriz A = 


lo -1 : ña 
E > Compruebe que la traza es igual a la suma de los valores característicos, y 


que el determinante es igual a su producto. 

Con la misma matriz A, resuelva la ecuación diferencial du/di = Au, u(0) = Hl 
¿Cuáles son las dos soluciones exponenciales puras? 

Si se pasa a 4 — 71, ¿cuáles son los valores característicos y los vectores característi- 
cos, y cómo están relacionados con los de 4? 


O o 
aman [5 31 








| 
| 


A O 


10. 


11. 
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Resuelva du/d: = Pu cuando P es una proyección: 
du 5 03 5 
E = É 4 u con u(0) = al 
Parte de u(0) crece exponencialmente mientras la parte del espacio nulo, permanece 


2 2 
fija. 


Encuentre los valores característicos y los vectores característicos de 


3.402 070.2 
A=|0 1 2 y B=|0 2 0 
0.0.0 2710070 


Compruebe que 4,+ A2+ Az es igual a la traza y que 14/4243 es igual al determinante. 


Proporcione un ejemplo para demostrar que los valores característicos pueden cam- 
biarse cuando un múltiplo de un renglón se resta de otro. ¿Por qué los pasos de elimi- 
nación no modifican un valor característico igual a cero? 


Suponga que A es un valor característico de A, y que x es un vector característico: 
Áx=Ax: 


a) Demuestre que este mismo x es un vector característico de B = A — 71, y encuen- 
tre el valor característico. Esto debe confirmar el ejercicio 3. 

b) Suponga que A % 0, demuestre que x también es un vector característico de A”?, y 
encuentre el valor característico. 


Demuestre que el determinante es igual al producto de los valores característicos, su- 
poniendo que el polinomio característico se factoriza coro 


det(A 21) =(A1 — A)QU2 A) +++ (An — A), (16) 
y haciendo una elección inteligente de A. 


En dos pasos, demuestre que la traza es igual a la suma de los valores característicos. 
Primero, encuentre el coeficiente de (—A)"7* en el miembro derecho de la ecuación 
(16). Luego, encuentre todos los términos de 


dit TA ar ... Ala 
021 da A +. Cn 
detíA — A17) = det 
Gni 212 A 1 A 


que implican a (—A)"7*. ¡Todos provienen de la diagonal principal! Encuentre ese 
coeficiente de (—A)"7?, y compare. 


a) Construya matrices de 2 por 2 tales que los valores característicos de A B no sean 
los productos de los valores característicos de A y B, y los valores característicos de 
A + Bno sean las sumas de los valores característicos individuales. 


b) Compruebe, no obstante, que la suma de los valores característicos de A + B es 
igual a la suma de todos los valores característicos individuales de A y B, y de ma- 
nera semejante para los productos. ¿Por qué es cierto lo anterior? 


Los valores característicos de A son iguales a los valores característicos de A?. Esto 
se debe a que det (4 — AD) es igual a det(4* — AD. Lo anterior es cierto porque E 
Demuestre con un ejemplo que los vectores característicos de A y A* no son los mis- 
mos. 
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12. Encuentre los valores característicos y los vectores característicos de 


A e e E 7 AS 
ea A 
13. Si los valores característicos de B son 1, 2, 3, los valores característicos de C son 4, 5, 
6, y los valores característicos de D son 7, 8, 9, ¿cuáles son los valores característicos 
de la matriz de 6 por6 Á = k 7 


14. Encuentre el rango y todos los cuatro valores característicos de la matriz de 1s y la ma- 
triz de tablero de ajedrez: 





1 

1 
¿ás 1 
1 


= Or O 
O » O 


1 
0 
1) 
0 


FOO 


E AS 
¡OS A | 
1 O 
VTA 
¿Cuáles vectores característicos corresponden a valores característicos diferentes de 


cero? 


15. ¿Cuáles son el rango y los valores característicos cuando A y C en el ejercicio previo 
son de n por n? Recuerde que el valor característico A = O se repite n — r veces. 


16. Si A es la matriz de 4 por 4 de 1s, encuentre los valores característicos y el determi- 
nante de A — /, 


17. Escoja el tercer renglón de la “matriz siguiente” 


OTE =0 
A=|0 0 1 


| 
| 
E 
+ 
; 
| 


de modo que su polinomio característico | A — 11] sea —A7 +41? + 52 +6. 


18. Suponga que los valores característicos de A son 0, 3, 5, con vectores característicos 
independientes ., Y, W. 
a) Proporcione una base para el espacio nulo y una base para el espacio columna. 
b) Encuentre una solución particular de Ax = v + w. Encuentre todas las soluciones. 
c) Demuestre que Ax = u no tiene solución. (En caso de tenerla, entonces es- 
taría en el espacio columna.) 


TIRA EDITE RATA ART ION URNA 


19. Las potencias A* de esta matriz A tienden al límite cuando k > oo: 


_ [0.8 0.3 2. FO.70. 0.45 056: 2006 
a= 03 ml de ee a SES: ES e 


La matriz A? está a mitad del camino entre A y A. Explique por qué A? = ¿(A + A*), 
a partir de los valores característicos y vectores característicos de estas tres matrices. 


20. Encuentre los valores característicos y los vectores característicos de las dos siguien- 


YO TPRAORPA 770 RARA NEON APEC CONAN LOS DAS 08 ASI ST RA ANIOS DR OC LAIR RAROO: 


tes matrices: 
_ 1.4 ZO 
a=|) | y a+i= | 2 
A + [ tiene los vectores característicos que A. Sus valores característicos están 
por 1, 


ds 


Saf; 


21. 


22. 


23. 


PA 


26. 


27. 


28. 


29. 
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Calcule los valores característicos y los vectores característicos de A y A”): 
A=|> 4 e =| 1/2 Al 


AT?! tiene los vectores característicos que A. Cuando los valores característicos 
de Á son A, y A, los valores característicos de su inversa son 





Calcule los valores característicos y los vectores característicos de A y A?: 


a=| 2 4 e = (7 ad 
A? tiene los mismos que A. Cuando los valores característicos de A sonA; y Az, 
los valores característicos de A? son 





a) Si se sabe que x es un vector característico, la forma de encontrar A es 
b) S1 se sabe que A es un valor característico, la forma de encontrar x es 


¿Qué se hace a Ax = Ax, para demostrar los incisos 4), b), y c)? 

a) A? es un valor característico de 4?, como en el problema 22. 

b) A7* es un valor característico de A7*, como en el problema 21. 

Cc) A + 1 es un valor característico de A + [, como en el problema 20. 


A partir del vector unitario u = (3, E, 2, 2), construya la matriz proyección de rango 

1P =uy?, 

a) Demuestre que Pu = y. Así, u es un vector característico con A = 1. 

b) Si v es perpendicular a u, demuestre que Pv = vector cero. Así, A = O. 

c) Encuentre tres vectores característicos independientes de P, todos con valor carac- 
terístico A = 0. 


Resuelva det (Q — A1) = 0, aplicando la fórmula cuadrática, para llegar a 4 = cos O 
+ ¿sen 0: 


oa ho —sen 0 


O ESO | rota el plano x-y por el ángulo 6. 


Resuelva (OQ — ADx = 0 para encontrar los vectores característicos de O. Use ¡? = 
LS 


Toda matriz permutación deja sin cambio ax = (1, 1,...,1).Así, A = 1. Encuentre 
dos As más para las siguientes permutaciones: 
Ost de 0-01 
P=10 0 1 Y PRO OA: 
100 2.0070 
SiA tiene 1, = 4 y A2 = 5, entonces det(A — AL) =(A —4KXA — 5) = 12 —- 94 +20. 


Encuentre tres matrices que cumplan lo siguiente: traza a + d = 9, determinante = 20, 
y A = 4,5. 


Se sabe que los valores característicos de una matriz B de 3 por 3 son O, 1, 2. Esta in- 
formación es suficiente para encontrar tres de los cuatro incisos siguientes: 

a) el rango de A, 

b) el determinante de B*B, 


| 
; 
t 
| 
| 
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30. 


31. 


32. 


33. 


353, 


36. 


3. 


38. 


3% 


40. 


c) los valores característicos de BYB, y 
d) los valores característicos de (B + D”?. 


Escoja el segundo renglón de A = DS A] de modo que los valores característicos de 


A sean 4 y 7. 


Escoja a, b, c, de modo que det (A — AD) = 91 — AÍ?. Así, los valores característicos 
San 3 Ud: 


O 1 0 
A=1|0 0 1]j 
a be 


Construya una matriz M de Markov de 3 por 3: la suma de los elementos positivos de 
cada columna es 1. Si e = (1, 1, 1), compruebe que Me = e. Por el problema 11, 
A = 1 también es un valor característico de M. Desafío: Una matriz singular M de 
Markov de 3 por 3 con traza 3 tiene valores característicos A = 





Encuentre tres matrices de 2 por 2 que tengan 4, = A2 = 0. La traza es cero y el de- 
terminante es cero. La matriz A podría no ser O, pero compruebe que A? = 0. 


La siguiente matriz es singular con rango 1. Encuentre tres As y tres vectores caracte- 
rísticos: 


1 o 
A=|2|[2 1 2]=|4 2 4 
1 PES UNES 
Suponga que A y B tienen los mismos valores característicos A,,..., A, con los mis- 


mos vectores característicos independientes x,,...,x,. Así, A = B. Razón: Cualquier 
vector x es una combinación C,x, + + + «+ C,X,. ¿Cuál es Ax? ¿Cuál es Bx? 


(Repaso) Encuentre los valores característicos de A, B, y C: 


OS 630-171. 1 21212 
A=|0 4 5|, B=]|0 2 Ol, y C=]|2 2 2 
0.06 ay 20 0 A. 


Cuando a + b = < + d, demuestre que (1, 1) es un vectór característico, y encuentre 
ambos valores característicos: 
O 
PO | . 
Rd 


Cuando P intercambia los renglones 1 y 2 y las columnas 1 y 2, los valores caracterís- 
ticos no cambian. Encuentre vectores característicos de A y PAP para = 11: 


A 4 6.3 3 
O o e y PAP=|2 1 1 


4 8 4 8 4 4 


Problema de desafío: ¿Existe alguna matriz real de 2. por 2 (distinta de D) con A? = 1? 
Sus valores característicos deben cumplir A? = 7. Pueden ser e3 y g7?r1/3. ¿Qué 
traza y qué determinante se obtienen con lo anterior? Construya A. 


Hay seis matrices permutación P de 3 por 3. ¿Cuáles números pueden ser los determi- 
nantes de P? ¿Qué números pueden ser los pivotes? ¿Qué números pueden ser la tra- 
za de P? ¿Cuáles cuatro números pueden ser valores característicos de P? 


. 
A : A a 
A MA A O O NOA 





PANAMA AOS RIO RAI NT 





=> 


E IS E q de . de cia e = e ds et ITA NAAA 
E E e: A AO VO NAL 
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5.2 DIAGONALIZACIÓN DE UNA MATA" 


Se empieza directamente con el cálculo esencial. Es perfectamente sencillo, y se utilizará en 
todas las secciones de este capítulo. Los vectores característicos de una matriz: 


Pre USAR KN 






-Diagonalización Ss 7lAS= 


La matriz $ se denomina “matriz vector característico”, y Á se denomina “matriz valor 
característico”, para la cual se utiliza una letra lambda mayúscula, ya que las lambdas mi- 
núsculas se usan para designar los valores característicos que están en su diagonal, 


Demostración Los vectores característicos x, se escriben en las columnas de $, y AS se 
calcula por columnas: 


AS=AÍÚX: %X2 -*** Xal = |A41X1 42% ***  AnZXn 


A 


Luego, el truco consiste en separar esta última matriz, en un producto SA bastante diferente: 
A 








O 0 E A A 


És vital mantener estas matrices en el orden correcto. Si A está antes de S (y no después), 
entonces A, multiplicará los elementos de la primera línea. Deseamos que A, aparezca en 
la LipietaRo columna. Si es bs entonces SA es correcto. Por tanto, 








, o . RN a A A A y Ps! 
dy 05 RADA grs, e 
e, 0, bien, F , 
A ás rad e. A Ñ 
, Dear ETA Y A S "Te 
<r a > eva 2 ¿ pe JA: 


S es ES ya que se supuso que sus columnas (los vectores característicos) son inde- 
pendientes. Antes de proporcionar ejemplos o aplicaciones es necesario presentar cuatro 


observaciones. Y 


Observación I Sila matriz A no tiene valores característicos repetidos; es decir, que los 
números Ay, ... , A, son distintos, entonces los n vectores característicos son automática- 
mente independientes (consulte el punto 5D a continuación). En consecuencia, cualquier 
matriz con valores característicos distintos puede diagonalizarse. 


Observación 2 La matriz de diagonalización S no es única. Un vector característico x 
puede multiplicarse por una constante y seguir siendo un vector característico. Las colum- 
nas de S pueden multiplicarse por constantes cualesquiera diferentes de cero, y producir 


0 
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una nueva matriz de diagonalización S. Valores característicos repetidos dejan aún más li- 
bertad en S. Para el ejemplo trivial A = /, cualquier S logra lo anterior: S”*IS siempre es 
diagonal (A es justo £). Todos los vectores son vectores característicos de la identidad. 


Observación 3 Otras matrices S no producen una A diagonal. Suponga que la primera 
columna de S es y. Entonces la primera columna de SA es A ,y. Si esto ha de coincidir con 
la primera columna de AS, que por multiplicación de matrices es Ay, entonces y debe ser 
un vector característico: Ay = A. y. El orden de los vectores característicos en S y de los va- 
lores característicos en Á es automáticamente el mismo. 


Observación 4 No todas las matrices poseen n vectores característicos linealmente inde- 
pendientes, de modo que no todas las matrices son diagonalizables. El ejemplo estándar 
de una “matriz defectuosa” es 
0-4 
Pe 


Sus valores característicos son 1; = A2 = O, ya que la matriz es triangular con ceros en la 
diagonal: 


PEA e —A 1 Ns 
det (A 21) = des | 0 a 


Todos los vectores característicos de esta A son múltiplos del vector (1, 0): 


o 1 0 Ea, bj e 
o o|*= loj» bien, x= Jpf. 


A = 0 es un valor característico doble: su multiplicidad algebraica es 2. Sin embargo, la 
multiplicidad geométrica es 1, porque sólo hay un vector característico independiente. No 
es posible construir $. 


A continuación se proporciona una demostración más directa de que A no es diagona- 
lizable. Debido a que A, = A, = 0, A tendría que ser la matriz cero. Pero si A = ST!AS, 
1 = 0, entonces se premultiplica por la izquierda por S y se posmultiplica por la derecha 
por S”*, con la finalidad de concluir falsamente que A = 0. No hay ninguna S invertible. 

Este fracaso de diagonalización no se debe a que 4 = 0. Proviene del hecho de que A; 
e Az: 


0073 1 0 


Sus valores característicos son 3, 3 y 1, 1. ¡No son singulares! El problema es la falta de 
vectores característicos, que se necesitan para S. Es necesario recalcar estas necesidades: 


Valores característicos repetidos A = E | y A = E ll 


La diagonalización de A depende de la existencia de suficientes vectores caracte- 


rísticos. 
La invertibilidad de A depende de los valores característicos diferentes de cero. 





No hay relación entre la diagonalización (1 vectores característicos independientes) y la in- 
vertibilidad (valores característicos diferentes de cero). La única indicación proporcionada 
por los valores característicos es: la diagonalización puede fracasar sólo si hay valores ca- 
racterísticos repetidos. Incluso así, no siempre fracasa. A = / tiene valores característicos 
repetidos 1, 1,..., 1, ¡aunque ya es diagonal! En este caso no hay carencia de vectores ca- 
racterísticos. 





Ejemplo 1 


Ejemplo 2 
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La prueba consiste en comprobar, para un valor característico que se repite p veces, si 
hay p vectores característicos independientes; en otras palabras, si el rango de A — A/ es 
n — p. Para completar este círculo de ideas, es necesario demostrar que valores caracterís- 
ticos distintos no ib En e 








PE 5D. i Si los vectores e: característicos ES dei “os ad -, corresponde a valores característicos : 
distintos day + Au. 0 






Pr 


Primero se supone que k = 2, y que con alguna combinación de x, y x, se obtiene ce- 
ro: C¿x, + C2x7 = 0. Al multiplicar por A, se encuentra C¡41x1 + C242x2 = 0. Al restar A, 
multiplicado por la ecuación previa, el vector x, desaparece: 


ciA1 ESE Ar)x1 = 0, 


Debido a que A, * A, y a que x, 7% O, se está forzando a que c, = O, De manera semejante, 
2 = 0, y los dos vectores son independientes; sólo la combinación trivial proporciona cero, 
Este mismo razonamiento se extiende a cualquier cantidad de vectores característicos: 
si con alguna combinación se obtiene cero, debe multiplicarse por A, restar A¿ multiplica- 
do por la combinación original, y entonces desaparece x;,, dejando una combinación de 
X1» + + + > Xx-1, Con lo cual se obtiene cero. Al repetir los mismos pasos (en realidad, esto es 
inducción matemática) se termina con un múltiplo de x, que produce cero. Así se obliga 
a que c, = 0, y finalmente a que todo c, = 0. En consecuencia, los vectores característicos 
que provienen de valores característicos distintos, son automáticamente independientes. 
Una matriz con n valores característicos distintos puede diagonalizarse. Este es el ca- 
so típico. 


Ejemplos de diagonalización 


El punto más importante de esta sección es ST1AS = A. La matriz vector característico S 
transforma A en su matriz valor característico Á (diagonal). Esto se verá a continuación pa- 
ra proyecciones y rotaciones. 


a o 

La proyección A = h 3 tiene matriz valor característico Á = E al Los vectores 
2 

característicos van en las columnas de S: 


ME 1 e ARO 
s=| E y As=SA=|) q 


La última ecuación puede comprobarse a primera vista. En consecuencia, S”!AS = A. 
Por sí mismos, los valores característicos no resultan tan evidentes para una rotación: 


sb 001 
rotación de 90? K= E o! tiene det (K — AI) =A +1. 
¿Cómo es posible que un vector rote, y aun así, preserve sin cambio su dirección? Apa- 
rentemente, lo anterior no es posible salvo para el vector cero, lo cual es inútil. Sin embar- 
go, debe haber valores característicos, y debe ser posible resolver du/dt = Ku. El polinomio 
característico A? + 1 debe seguir teniendo dos raíces, aunque no son reales. 


Ahora, el lector puede ver el camino de salida. Los valores característicos de K' son 
números imaginarios, A; = iy A, = —i. Tampoco los vectores característicos son reales. 


entonces estos s YeCtores característicos son n linealmente indepen A, 
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De alguna manera, al rotar 90%, se multiplican por ¿ o por —1: 

lo A O 1 
bald + «(a 
o EE O 1, 1 

Led + =-[) 


Los valores característicos son distintos, aun cuando son imaginarios, y los vectores carac- 
terísticos son independientes. Estos van en las columnas de S: 


UE E | PO E 
10 y mesi) 


Se está frente a un hecho ineludible: los números complejos son necesarios incluso 
para matrices reales. Si hay muy pocos valores característicos reales, siempre hay n valo- 
res característicos complejos. (Los complejos incluyen a los reales, cuando la parte imagi- 
naria es cero). Si hay muy pocos vectores característicos en el mundo real R3, o en R”, se 
busca en C? o en C”. El espacio C” contiene a todos los vectores columna con componen- 
tes complejas, y posee nuevas definiciones de longitud, producto interno y ortogonalidad. 
Sin embargo, no es más difícil que R”, y en la sección 3.5 se realiza una sencilla conver- 
sión al caso complejo. 


ll 
Il 


(K —A11L)x, 


1 
tl 


(K —=21)x 





Potencias y productos: A' y A B 


Hay una situación adicional en que los cálculos son fáciles. Los valores característicos de 
A? son exactamente M2,...,12, y cada vector característico de A también es un vector 


característico de A”. Se empieza con Ax = Ax, y se multiplica de nuevo por A: 
Afx = Añx =AAx = Ax. (3) 


É 
o 
E 
E 
É 
É 


Por tanto, A? es un valor característico de A?, con el mismo vector característico x. Si la pri- 
mera multiplicación por A deja sin cambio la dirección de x, entonces también lo hace la 


segunda. 
El mismo resultado se obtiene de la diagonalización, al elevar al cuadrado a SAS 


= Á: 

Valores característicos de 4? (57! ASUSTA) = A? jombien. STELAZS =A?. 
La matriz A” es diagonalizada por la misma S, de modo que los vectores característicos per- 
manecen sin cambio. Los valores característicos están al cuadrado. Este hecho se cumple 
para cualquier paigitina de A: 





- Cada s ( * cancela a a una, as, excepto por la. primer S 


Si A es invertible, esta regla también es válida para su inversa (la potencia k = —1). 
Los valores característicos de A”* son 1/).,. Este hecho puede verse incluso, sin diagona- 
lizar: 
1 
Si Ax=Ax entonces x=AA7“lx y ÓS A“ 





45% 


A de. , 
ÑO pie p , ? . ' 
FAM NADO e ta OACI 0 A RCTV MAR LIME ¿CUINA la A 0 GIO RA 00 ROT DR Mp) 120 PDA PADRE LPR ON ACA O I CIAALE AAA pe = ey 


do 
h 
E! 


Ejemplo 3 
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Si K es una rotación de 90%, entonces K? es una rotación de 180” (lo cual significa —D) y 
KT? es una rotación de —90*: 


E 0 a a a! 0 “o O 1 
K= |; e K0=| 0 6 y ee = A 
Los valores característicos de K son i y —i; sus cuadrados son —1 y —1; sus recíprocos son 
1/1i == —iy 11 = i Así, K* es una rotación completa de 360": 


O Y E :: O bl 0 0 
K E i y también —AÁ p (iy o 1l: 


Para un producto de dos matrices, puede preguntarse sobre los valores característicos 
de A B, aunque no se obtiene una buena respuesta. Es bastante tentador tratar de aplicar el 
mismo razonamiento, esperando demostrar que en general no es cierto. S14 es un valor ca- 
racterístico de A y ¡u es un valor característico de B, entonces he aquí la falsa demostración 
de que A B tiene el valor característico, A: 


Demostración falsa ABx = Aux = uAx = Ax. 


El error consiste en suponer que A y B comparten el mismo vector característico x. En ge- 
neral, no es así, Es posible que haya dos matrices con valores característicos cero, mientras 
A B tiene valor característico A = 1: 


MO 0 ES al O DO E ME Y NO 
Ha o di Y o! Ñ E de 

Los vectores característicos de estas A y B son totalmente distintos, lo cual es típico. Por la 
misma razón, en general los valores característicos de A + B no tienen nada que ver con A 
0 

Esta falsa demostración sugiere ser verdadera. Si el vector característico es el mismo 
para A y B, entonces los valores característicos se multiplican y el valor característico de 
ABes 14. Sin embargo, se tiene algo más importante. Hay una forma fácil de identificar 


cuándo A y B comparten un conjunto completo de vectores característicos, lo cual plantea 
una cuestión clave en mecánica cuántica: 





Demostración Si la misma S diagonaliza tanto a A=5SA¡S7! y B=SA2S”*, puede 
multiplicarse en cualquier orden: 


AB=35A15 "SAS = SAS"? y BA=SA:¡5S SAS? = SA AS ”. 


Debido a que A,A2 = A2A, (las matrices diagonales siempre son conmutativas) se tiene 
que AB = BA. 
En la dirección opuesta, suponga que AB = BA. Empezando con Áx = Ax, se tiene 
ABx = BAx = Bldx =ABx. 

Así, tanto x como Bx son vectores característicos de A, que comparten el mismo A (o bien, 
Bx = 0). Si por conveniencia se supone que los valores característicos de A son distintos; 
es decir, que todos los espacios característicos son unidimensionales, entonces Bx debe ser 
un múltiplo de x. En otras palabras, x es un vector característico de B, así como de A. La 
demostración con valores característicos repetidos es un poco más larga. e] 
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El principio de incertidumbre de Heisenberg proviene de las matrices no conmutati- 
vas, como la posición P y la cantidad de movimiento O. La posición es simétrica, la canti- 
dad de movimiento es simétrica sesgada, y juntas cumplen OP — PQ = [. El principio 
de incertidumbre se concluye directamente de la desigualdad de Schwarz (0) (Px) < 
HOXNIPx de la sección 3.2: 


ll? = xx =x"(QP — PO)x < 219x111 Px ll. 


El producto de | Oxll/llxll y 1Px1/fxI| —los errores de posición y cantidad de movi- 
miento, cuando la función de onda es x— es por lo menos z. Es imposible que ambos erro- 
res sean pequeños, porque al intentar medir la posición de una partícula se modifica su 
cantidad de movimiento. 

Al final se volverá a A = SAS”?. Esta factorización es particularmente idónea para 
tomar potencias de A, y la cuestión se ilustra con el caso más simple: A?. La factorización 
LU es inútil cuando se eleva al cuadrado, pero SAS”! es perfecta. El cuadrado es SA?5S7!, 
y los vectores característicos permanecen sin cambio. Trabajar con estos vectores caracte- 
rísticos permite resolver ecuaciones en diferencias y ecuaciones diferenciales. 





Br Conjunto de problemas 5.2 
1.  Factorice las siguientes matrices en SAS”*!: 
A e E ca! 


2. Encuentre la matriz A cuyos valores característicos son 1 y 4, y cuyos vectores carac- 
e . E . . om. 
terísticos son e y el respectivamente. (Sugerencia: A = SAS”!.) 


3. Encuentre todos los valores característicos y los vectores característicos de 


1 
A=|1 1 1 
o Al 


hs , E TROA 
» a a 
CAE NIITIN INTENTA ITA TA AIRE ARAS TORITO. 4 AS AÍTO CATA ATT ESTARIA PGR LORO ora A BLA 
ve IS ARCAS t A 


y escriba dos matrices de diagonalización S distintas. 


4. Si los elementos diagonales de una matriz triangular superior de 3 por 3 son 1, 2, 7, 
¿cómo puede saberse que la matriz es diagonalizable? ¿Cuál es A? 


5. De las siguientes matrices, ¿cuál(es) no puede(n) diagonalizarse? 


LE O nO 
dd E 5 da = E Es 23 E 2 
6. 1) SiA? = [, ¿cuáles son los posibles valores característicos de A? 


b) Sí esta matriz A es de 2 por 2, y noes [o —[, encuentre su traza y su determinante. 
c) Si el primer renglón es (3, —1), ¿cuál es el segundo renglón? 


7. SiA= E ah encuentre A'%, diagonalizando A. 


Suponga que A = uv” es una columna multiplicada por un renglón (una matriz con 
rango 1). 


a) Multiplique A por u, para demostrar que u es un vector característico. ¿Cuál es 1? 
b) ¿Cuáles son los otros valores característicos de A (y por qué)? 
c) Calcule traza (4), a partir de la suma de la diagonal y la suma de los As. 





10. 


11. 


12. 


13. 


14. 


Y 21703 8 
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Demuestre por cálculo directo que A B y BA tienen la misma traza cuando 
7 E + E y 
ala» »- 7 


Concluya que AB — BA = Tes imposible (excepto en dimensiones infinitas). 


Suponga que los valores característicos de A son 1, 2, 4. ¿Cuál es la traza de A?? ¿Cuál 
es el determinante de (47 MP? 


Si los valores característicos de A son 1, 1, 2, ¿de cuáles de las siguientes afirmacio- 
nes se tiene la certeza de que son verdaderas? 

Proporcione un razonamiento de por qué sí son verdaderas o un ejemplo si no son ver- 
daderas. 


a) A es invertible. 
b) A es diagonalizable. 
c) A no es diagonalizable. 


Suponga que sólo los vectores característicos de A son múltiplos de x = (1, 0, 0). Fal- 
so O verdadero: 

a) Ano es invertible. 

b) A tiene un valor característico repetido. 

c) Á no es diagonalizable. 


Diagonalice la matriz A = E ¿| y encuentre una de sus raíces cuadradas: una ma- 


triz tal que R? = A. ¿Cuántas raíces cuadradas hay? 


Suponga que la matriz vector característico S tiene SY = S”?, Demuestre que A = 
SAS”? es simétrica y tiene vectores característicos ortogonales. 


Los problemas 15 a 24 son sobre matrices valor característico, y vector característico. 


15. 


16. 


¡ye 


18. 


19. 


20. 


Factorice las siguientes matrices en A = SAS”?: 


a Mi 
alo 3] y a=lo) 
SiA =SAS”! entonces A45=([( X X ) y A“=C( XX). 


: , Sn e E 
Si A tiene A; = 2 con vector característico X1 = E y AQ = 3 con % = El use 
SAS”? para encontrar A. Ninguna otra matriz tiene los mismos As y xs. 


Suponga que A = SAS”!. ¿Cuál es la matriz valor característico para A + 2/7? ¿Cuál 
es la matriz vector característico? Compruebe que A +27 =( X IX)”. 


¿Falso o verdadero? Si las n columnas de S (vectores característicos de A) son inde- 
pendientes, entonces 


a) A es invertible. 
b) A es diagonalizable. 
c) S es invertible. 
d) S es diagonalizable. 


Si los vectores característicos de A son las columnas de /, entonces Á es una matriz 
_____ Sila matriz vector característico S es triangular, entonces 5”? es triangular y 
A es triangular. 


252 





Capítulo 5 Valores característicos y vectores característicos 


21. Describa todas las matrices 5 que diagonalizan la siguiente matriz A: 
4 0 
A= BP sl | 
Luego describa todas las matrices que diagonalizan a A”7?- 


/ AE 5 1 1 
22. Escriba la matriz más general que tenga vectores característicos la bl | : 


23. Encuentre los valores característicos de A y By A + B: 


1 0 E E | | 
poa P Al 3 E ie E E 2 
Los valores característicos de A + B (son iguales ano son iguales a) los valores ca- 
racterísticos de A más los valores característicos de B. 


24. Encuentre los valores característicos de A, B,ABy BA: 


10 0 de ES | lo dl A ta 
alii alo) e+li2) + (3) 
Los valores característicos de A B (son iguales ano son iguales a) los valores carac- 


terísticos de A multiplicados por los valores característicos de B. Los valores caracte- 
rísticos de A B (sonmM(no son) iguales a los valores característicos de BA. 


Los problemas 25 a 28 son sobre la diagonalizabilidad de A. 


25. ¿Falso o verdadero? Si los valores característicos de A son 2, 2, 5, entonces la matriz 


ciertamente es 

a) Invertible. 

b) Diagonalizable. 

c) No diagonalizable. 


26. Silos valores característicos de A son 1 y O, escriba todo lo que sepa sobre las matri- 
ces A y A?. 


27. Complete las siguientes matrices de modo que det A = 25, Así, traza = 10, y ¡A =5 
es repetido! Encuentre un vector característico con Ax = Sx, Estas matrices no son dia- 
gonalizables porque no hay una segunda línea de vectores característicos. 


E: _[9 4 os 
Po aPi y a [07 


28. La matriz A = E a no es diagonalizable porque el rango de A — 37 es 
Cambie un elemento para hacer diagonalizable a A. ¿Qué elementos podría cambiar? 
Los problemas 29 a 33 son sobre potencias de matrices. 


29. At=SAFS7! tiende a la matriz cero cuando k —> oo si y sólo si el valor absoluto de 
cada A es menor que . ¿Qué es cierto: A* => 0 o B*-> 07 


Os Ea c+ 5 e Ph | 





0.4 0.6 OL 1006 


30. (Recomendado) Encuentre Á y $ para diagonalizar A en el problema 29. ¿Cuál es el 
límite de A% cuando k —>00? ¿Cuál es el límite de SA*571? En las columnas de esta 
matriz limitante, es posible observarel_____ 


es Ape de 
AA AO 


Ba 
NAS 13] 
Él AS 
ANT 
el ; 





' rr de ÓN 
AS 
. A is 
MOS 

AI Cn 0 
Be 
ds 
4: 


¿10 
cl O al : 4 pia A 
; s CAU 1 
O A LoS in ACA am JOA IS ECOS JARA INR ba 
a p o ' mí y MAN ON 
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31. Encuentre Á y S para diagonalizar B en-el problema 29. ¿Cuál es B*%y¿ para estos y? 


li ome 


32. Diagonalice A y calcule SA*S”! con la finalidad de demostrar esta fórmula para A*: 


ESA dl 


al : 0% 
a= |; Al a E: E 


33. Diagonalice B y calcule SA*S”* con la finalidad de demostrar esta fórmula para B*: 


pa És 1 . ; E 3. 3-2 
B=|> 3 tiene B = 1% ok ' 


Los problemas 34 a 44 son nuevas aplicaciones de A+= SAS”, 


34. Suponga que A = SAS”?. Tome determinantes par demostrar que Á = AjA2::: 
A, = producto de As. Esta rápida demostración sólo funciona cuando Á es 


35. La traza de $ multiplicado por AS”! es igual a la traza de AS”? multiplicada por $. 
Así, la traza de una matriz diagonalizable A es igual a la traza de A, que es , 


36. Si A = SAS”!, diagonalice la matriz en bloque B = E A Encuentre sus matrl- 
ces valor característico y vector característico. 


37. Considere todas las matrices A de 4 por 4 que son diagonalizadas por la misma matriz : 
vector característico fija S. Demuestre que las As constituyen un subespacio (cA y A, + 
A, tienen esta misma $). ¿Cuál es este subespacio cuando S = 7? ¿Cuál es su dimen- 
sión? 

38. Suponga que 4? = A. En el miembro izquierdo A multiplica cada columna de A. ¿Cuál 
de los cuatro subespacios contiene vectores característicos con 4 = 1? ¿Qué subespa- 
cio contiene vectores característicos con A = 0? Con base en las dimensiones de es- 
tos subespacios, A tiene un conjunto completo de vectores característicos 
independientes y es posible diagonalizarla. 


39. Suponga que Ax = Ax. SiA = O, entonces x está en el espacio nulo. S1 A 7% O, enton- 
ces x está en el espacio columna. Las dimensiones de estos subespacios son (n —r) + 
r = n. Entonces, ¿por qué ninguna matriz cuadrada tiene n vectores característicos li- 
nealmente independientes? 


40. Sustituya A = SAS”! en el producto (A — AICA — A21)-- (A — Ar). y expli- 
que por qué esto produce la matriz cero. Se está sustituyendo la matriz A por el núme- 
ro A en el polinomio p(A) = det(A — AD). El teorema de Cayley-Hamilton establece 
que este producto siempre es p(A) = matriz cero, incluso si A no es diagonalizable. 

41. Pruebe el teorema de Cayley-Hamilton en la matriz de Fibonacci A = a 3 El 
teorema pronostica que 4? — A — 7 =0, ya que det (4 — ADesA*—2A— 1. 

42. SiA = É al entonces det (A — AD es (A — aMA — d). Compruebe la afirmación 


del teorema de Cayley-Hamilton de que (4 — aDXCA — dD = matriz cero. 


43. SiA= E 2! y AB = BA, demuestre que B = E a también es diagonal. B tie- 


ne los mismos característicos que A, pero diferentes característicos. Es- 
tas matrices diagonales B constituyen un subespacio bidimensional del espacio de ma- 
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trices. AB — BA = O proporciona cuatro ecuaciones para las incógnitas a, b, c, d. En- 
cuentre el rango de la matriz de 4 por 4. 


44. SiA es de $5 por 5, entonces AB — BA = matriz cero proporciona 25 ecuaciones pa- 
ra los 25 elementos de B. Demuestre que la matriz de 25 por 23 es singular, indican- 
do una simple solución B diferente de cero. 


45. Encuentre los valores característicos y los vectores característicos para las dos siguien- 
tes matrices A y AY de Markov. Explique por qué A*% está próxima a A”: 


_ [0.6 0.2 A EN 
a= 0 re yA = e 


5.3 ECUACIONES EN DIFERENCIAS Y POTENCIAS Af 


Las ecuaciones en diferencias Uy. = AU, Se mueven hacia adelante en un número finito 
de pasos finitos. Una ecuación diferencial asume una infinidad de pasos infinitesimales, 
aunque ambas teorías permanecen absolutamente en paralelo. Se trata de la misma analo- 
gía entre el discreto y el continuo que aparecen una y otra vez en matemáticas. Un buen 
ejemplo es el interés compuesto cuando el paso temporal se hace más corto. 

Suponga que se invierten $1000 al 6% de interés. Si se compone una vez al año, el ca- 
pital P se multiplica por 1.06. Esta es una ecuación en diferencias Py, = AP, = 1.06 P, 
con un paso temporal de un año. Al cabo de 5 años, la Py = 1000 original se ha multipli- 
cado cinco veces: 


Anual Ps =(1.06) Po quees (1.06) 1000 = $1338. 


Ahora suponga que el paso temporal se reduce a un mes. La nueva ecuación en diferencias 
ES Px+1 = (1+ 0.06/12)p,. Luego de 5 años, o 60 meses, se tienen $11 más: 


0.06% PA 
Mensual pso=|1+ q) Po quees (1.005) 1000 = $1349. 


El paso siguiente es componer cada día, sobre 5(365) días. Esto es de poca ayuda: 


365 


Finalmente, para mantener activos a sus empleados, los bancos ofrecen composición con- 
tinua. El interés se suma a cada instante, y la ecuación en diferencias fracasa. Es de espe- 
rar que el tesorero no sepa cálculo (lo cual es todo sobre límites cuando Az —> 0). El banco 
puede componer el interés N veces al año, de modo que Af = 1/N: 


O. 06 3N 
Continuamente ( + +) 1000 => e%%% 1000 = $1349.87. 


0.06 15365 
Composición diaria ( + 5) 1000 = $1349 83. 


O bien, el banco puede pasar a una ecuación diferencial: el límite de la ecuación en dife- 
rencias Py+1 = (1 + 0.06A Dp,. Al pasar pz al miembro izquierdo y dividir entre Áf, se ob- 
tiene 


De discreto a DLE SDE o dp _ ; 
2 A a 0.06pz tiende a a 0.06p. E 
La solución es p(+) = e* “Spy. Al cabo de : = 5 años, lo anterior nuevamente suma 


$1349.87, El capital sigue siendo finito, aun cuando se componga a cada instante, y la me- 
joría sobre la composición diaria es de sólo cuatro centavos. 





5.3 Ecuaciones en diferencias y potencias A* 255 


Números de Fibonacci 


El objetivo principal de esta sección es resolver uz, ; = Aug. Lo anterior lleva a Af y a po- 
tencias de matrices. El segundo ejemplo es la famosa sucesión de Fibonacci: 


Números de Fibonacci 0,1,1,2,3,5,8,13,.. 


Este es el patrón: cada número es la suma de ¡eS dos números de Fibonacci previos Fs: 


Penta 


Ecuación de Fibonacci Fra ==. = Fr + 170 : (2) 


Ésta es la ecuación en diferencias. Aparece en una inmensa variedad de aplicaciones, de 
suyo merece todo un líbro. Las hojas crecen siguiendo un patrón en espiral, y en el man- 
zano o en el roble se encuentran cinco crecimientos por cada dos vueltas alrededor del ta- 
llo. El peral tiene ocho crecimientos por cada tres vueltas, y el sauce es 13:5. Parece que el 
campeón es un girasol cuyas semillas escogen una razón casi increíble de F,»/F,3 = 
144/233.* 

¿Cómo es posible encontrar el milésimo término de Fibonacci sin empezar en Fy = O 
y F, = 1, y trabajar hasta llegar a F 000? El objetivo es resolver la ecuación en diferencias 
Fis = Fist Fr. Esta ecuación puede reducirse a una ecuación de un paso Ez] = AU yo 
Cada paso multiplica u¿ = (F¿,, F¿) por una matriz A: 


Fr+z = Fur + Fr 


se convierte en Up+] = 1 1 Fes = ÁUk: (3) 
Pia Pi 


A 


El sistema de un paso uz, = Au €es fácil de resolver. Empieza desde y. Luego de un 
paso se obtiene 4, = Ay. Luego, u, es Au, que es A?%u¿. Cada paso conlleva una multi- 
plicación por A, y al cabo de k pasos hay k multiplicaciones; 





El verdadero problema consiste en encontrar alguna forma rápida para calcular el milési- 
mo término de Fibonacci. La clave se encuentra en los valores característicos y en los vec- 
tores característicos: 





Después de k pasos, u, es una combinación de las n “soluciones puras” A£x, 


"Para estas aplicaciones en botánica, consulte el líbro On Growth and Form de D'Arcy Thompson (Cambridge 
University Press, 1942), o la hermosa obra de Peter Stevens, Patterns in Nature (Little, Brown, 1974). Cientos de 
otras propiedades de los F,, han sido publicadas en el Fibonacci Quarterly. Parece que fue Fibonacci quien llevó 
los números arábigos a Europa, alrededor de 1200 d.C. 
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Estas fórmulas constituyen dos métodos para encontrar la misma solución 
uz = SA*S7*u0o.. La primera fórmula reconocía que A* es idéntica con SAX*STI, y es po- 
sible detenerse ahí. Sin embargo, el segundo método conlleva la analogía con una ecuación 
diferencial: las soluciones puramente exponenciales e**x; son ahora las potencias pu- 
ras de )%x;. Los vectores característicos x, son amplificados por los valores característicos 
A; Al combinar estas soluciones especiales para coincidir con uy —que es de donde pro- 
viene c— se recupera la solución correcta uy = SA*ST"luo. 

En cualquier ejemplo específico como el de Fibonacci, el primer paso es encontrar los 
valores característicos: 








ar 7? e tiene det (A —A1) =24—A— 1 
1+v5 = 
Dos valores característicos 1; = EE y Al= a pos 


El segundo renglón de A — Af es (1,— 1). Para obtener [4 — Ax = O, el vector caracte- 
rístico es x = (A, 1). Los primeros números de Fibonacci Fy = O y F, = 1 van en uy, y 
STiup =: 


-1 
iS dh A 1 A 1/(1 — 2) 1 1 
ES 2 Ea 1 ¿7 e ES 
S “uo | 1 1 | B proporciona c a EN A l=t 
Estas son las constantes en 44 = ciAtxj + ca bxz. Ambos vectores característicos x, y 


xz tienen por segunda componente a 1. Lo anterior deja F, = c1Af + c2A£ en la segunda 
componente de tj. 





Números de mo JA 1445 Y pay 
Fibonacci E > de 7 


Esta es la respuesta que se buscaba. Las fracciones y las raíces cuadradas se ven sorpren- 
dentes porque la regla de Fibonacci Fiwo = Fy,1 + F¡ debe producir números enteros. De 
alguna manera esa fórmula para F, debe proporcionar un entero. De hecho, como el segun- 
do término [(1 — /3)/21*/V5 siempre es menor que 2 sólo debe mover el primer térmi- 


no al entero más próximo: 
1000 
1+43 


E 1 
Fi000 = entero más próximo a —= > 


/5 


Este número es enorme, y Fyg901 es todavía más grande. Las fracciones se. vuelven insigni- 
ficantes, y el cociente F;001/F1000 debe estar muy próximo a (1 + 45 2 = 1.618. Debi- 
do a que 14 es insignificante en comparación con Af, el cociente F¿,1/F, tiende a 4.1. 


Esta es una ecuación en diferencias típica, que lleva a las potencias de A = E o 


Implica /5 porque así lo hacen los valores característicos. Si se escoge una matriz con 
241 =1y4,= 6, es posible centrarse en la simpleza del cálculo, después que se ha diago- 
nalizado A: 


AS OO ES EE A E 
a=| y tenez =1 y 6, con 4 -[, ym = [7] 


ki kaoa1 1 —L As 0 2 1 da 2-6 1-6 
SNE E e jj1 1] ]=2+2.68 -142-6*) 


Las potencias 6% y 1 aparecen en la última matriz A*, mezcladas por los vectores caracte- 
TÍStiCOS. 





; z A E js < TT 
4 (ay des A 
PIDIO A API A AO II od LR ORAR TARO UR o od 
' de a 
cn 
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Para la ecuación en diferencias ¿+1 = Au, se recalca la cuestión principal. Cada vec- 
tor característico x produce una “solución pura” con potencias de A: 


Una solución es Uy Fx, ur =1Ax, uz = 





Cuando el uy inicial es un vector característico x, esta es la solución: uy = A%x. En ge- 
neral, uy no es un vector característico. Pero si uy es una combinación de vectores caracte- 
rísticos, entonces la solución u, es la misma combinación de estas soluciones especiales. 





Matrices de Markov 


En el capítulo 1, hay un ejercicio sobre salir y entrar a California, que merece un análisis 
más detallado. Las reglas eran las siguientes: 


Cada año, +5 de la gente que vive fuera de California se cambia a este estado, y 5 de la 
gente que vive en California sale del estado. Se empieza con yy gente fuera y zy dentro. 


Al final del primer año las cantidades fuera y dentro son y; y Z;: 


Ecuación en y, = 0.9yo + 0.2zg bien 5d AE 0.9 0.21 |yo 
diferencias — z, =0.1yp +0.8z0 ; Z1 0.1 0.8 


Este problema y su matriz poseen las dos propiedades esenciales de un proceso de Mar- 
kov: 


1. El número total de gente permanece fijo. La suma de cada columna de la matriz de 
Markov es 1. No se gana ni pierde a nadie. 

2. Los números de gente afuera y dentro jamás pueden volverse negativos: La matriz no 
tiene elementos negativos. Todas las potencias de A* son no negativas.” 


Esta ecuación en diferencias de Markov se resuelve, usando uy = SA*ST*ug. Lue- 
go se demuestra que la población tiende a un “estado estacionario”. Primero es necesario 
diagonalizar a A: 


ee Y 0.9 —A 0.2 . q S yA E 

AS HE | 01 08- | tiene det (A —AI) = 4% — 1.74 +0.7 

ki = 1 A.=0.7: A=SAS?*= 5 5 : . . 
; ed ll 0.71 |1 —2 





"Además, la historia ha sido relegada por completo; cada nuevo y, depende sólo del u, actual. Tal vez incluso 
nuestras vidas son ejemplos de procesos de Markov, aunque espero que no lo sean. 


Ds ae 
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Para encontrar 4%, y la distribución luego de k años, SAS”? se cambia por SA*S”1: | 
a 1  1l bo | 
Zk Zo : — 3 0.7 1 —2 Zo dl 
2 1 ] 
= (yo +20) [9] + Go — 220(0.7)* Pal í 
3 3 ¿ 
Los dos términos son c¡A£x, + c245x2. El factor 14 = ] está escondido en el primer tér- | 
mino. A largo plazo, el otro factor (0.7) se vuelve extremadamente pequeño. La solución : 
tiende a un estado limitante Ux = (Yo, Zoo): 
y 2 
Estado estacionario 21 =(yo + Zo) |? 
eS 3 


La población total sigue siendo yy + Zg, pero en el límite 5 de esta población está fuera de 
California y 5 está dentro. ¡Lo anterior es cierto sin importar cuál haya sido la distribución 
inicial! Si el año empieza con 5 fuera y 5 dentro, entonces termina de la misma forma: 


0.9 02 
0.1 5008 
El estado estacionario es el vector característico de A correspondiente a 1 = 1. Multipli- 


car por A, de un paso temporal al otro, deja sin cambio a uso. 
La teoría de los procesos de Markov, se ilustra con este ejemplo de California: 


Mí Guin 


, —Obien, Als = Un. 


Upa Quin 





Para encontrar el múltiplo idóneo de x,, se usa el hecho de que la población total permane- 
ce Igual. Si California empezó con todos sus 90 millones de gente fuera, entonces terminó 
con 60 millones fuera y 30 dentro. Termina de la misma forma si originalmente los 90 mi- 
llones están dentro. 

Se observa que muchos autores trasponen la matriz, de modo que la suma de sus ren- 
glones es 1. 


Observación Esta descripción de un proceso de Markov fue determinista: las poblaciones 
se movieron en proporciones fijas. Pero sí se considera un simple individuo, las fracciones 
que se mueven se convierten en probabilidades. Un individuo fuera de A entra con 
probabilidad ;; 2 a este estado. Si está dentro, la probabilidad de salir es 5 . El movimiento 
se vuelve un oso aleatorio, y A se denomina matriz de transición. 

Las componentes de u, = A%4y especifican la probabilidad de que el individuo esté fue- 
ra O dentro del estado. Estas probabilidades nunca son negativas, y su suma es 1; es decir, 





Ejemplo 1 
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todo mundo debe estar en algún sitio. Esto retrotrae las dos propiedades fundamentales de 
una matriz de Markov: La suma de cada columna es 1, y ningún elemento es negativo. 

¿Por qué A = 1 siempre es un valor característico? La suma de cada columna de A — / 
es 1 — 1 = 0, En consecuencia, la suma de los renglones de A — / es el renglón cero, los 
renglones son linealmente dependientes, y det (A — D = 0. 

Excepto por casos muy especiales, u, tiende al vector característico correspondiente.” 
En la fórmula u = c¡AÍjxy +++ +cnAfx, ningún valor característico puede ser mayor 
que 1. (En caso contrario se inflarían las probabilidades uy). Si todos los demás valores ca- 
racterísticos son estrictamente menores que A, = 1, entonces el primer término en la fórmu- 
la es dominante. Los otros Af se van a Cero, Y uz —> C1x, = Us = estado estacionario. 

Este es un ejemplo de uno de los temas torales de este capítulo: Dada información so- 
bre Á, encontrar información sobre sus valores característicos. Aquí se encontró Amax = 1. 


Estabilidad de Y, , + = AU, 


Hay una diferencia evidente entre los números de Fibonacci y los procesos de Markov. Los 
números F, se vuelven cada vez más grandes, mientras la definición de “probabilidad” es- 
tá entre O y 1. La ecuación de Fibonacci es inestable. También lo es la ecuación del interés 
compuesto P,.,, = 1.06P,; el capital crece por siempre. Si las probabilidades de Markov 
decrecen a cero, esa ecuación sería estable; pero no lo hacen, ya que en cada etapa su su- 
ma debe ser 1. En consecuencia, un proceso de Markov es neutralmente estable. 

Se desea estudiar el comportamiento de uz+; = Auz cuando k —>00, Suponiendo que 
A puede diagonalizarse, u, es una combinación de soluciones puras: 


Solución en el instante ku =SAFST" uy =cyAlíxi + ++ + craAiXa. 
El crecimiento de u, está regido por los A£. La estabilidad depende de los valores carac- 


terísticos: 


rt 





La matriz A es ciertamente estable: 


O 4 


A = | 1| tiene valores característicos 0 y z. 
2 


Los As están en la diagonal principal porque A es triangular. Empezando con cualquier uo, 
y siguiendo la regla 4x+1 = Aux, la solución debe terminar por tender a cero: 


O 4 Z 
ug = 3 o a > ua = : e , lg = 


1 


pera 


, 


1 

2 
L 
16 


Nim 
Pje 
CQje. 


“Si todos los que están afuera se mueven hacia dentro y todos los que están adentro se mueven hacia fuera, entonces 
, 0 E ARAN pa o th. 
las poblaciones se invierten cada año y no hay estado estacionario. La matriz de transición es A = | 0 | el 


es un valor característico, así como +1, lo cual no puede ocurrir si todos los 4 > O. 


— amina rós Sere 
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Ejemplo 2 


El mayor valor característico A = 5 rige la disminución; después del primer paso, cada uz 
es 5u «-1. El verdadero efecto del primer paso, es separar uy en los dos vectores caracterís- 


ticos de A: 
pe 8 8 pen 1 E 8 k —8 
Up = N + | a y entonces uy = (3) hi + (0) | Al 


Matrices positivas y aplicaciones a la economía 


Al desarrollar las ideas de Markov es posible encontrar una pequeña mina de oro (comple- 
tamente opcional) de aplicaciones matriciales a la economía. 


Matriz entrada-salida de Leontief 

Este es uno de los primeros grandes éxitos de la economía matemática. Para ilustrarlo, se 
construye una matriz consumo, en la que a, proporciona la cantidad del producto j que 
se requiere para obtener una unidad del producto i: 


04 0 01 (acero) 
A = Ue ¡Une <0LS: lo. (alimentos) 
an “UI 0 (trabajo) 


La primera pregunta es: ¿Es posible producir y, unidades de acero, y, Unidades de alimen- 
tos, y yz unidades de trabajo? Es necesario empezar con grandes cantidades py, DP», P3, por- 
que una porción se consume en la producción misma. La cantidad que se consume es Ap, 
y deja una producción neta de p — Ap. 


Problema Encontrar un vector p tal que p — Ap = y, o bien, p = U — AJy?y. 


Aparentemente sólo se está preguntando si / — A es invertible. Sin embargo, hay un giro 
negativo del problema. La demanda y la producción, y y p, son no negativas. Debido a que 
pes (1 — AJ7?y, la verdadera pregunta es sobre la matriz que multiplica a y: 


¿Cuándo ocurre que (1 — Ay”? es una matriz no negativa? 


Aproximadamente, A no puede ser demasiado grande. Si la producción consume demasia- 
do, nada queda como salida. La clave radica en el mayor valor característico A, de A, que 
debe ser menor que 1: 


si Ay > 1, (Y — A)” ? fracasa en ser no negativa. 
sid, = 1, (7 — A)”? fracasa en existir. 
si A, < 1, (U — A)? es una suma convergente de matrices no negativas: 


AROS 


Serie geométrica —¿((=4ATV=L FAR 





PO ie lt 
En el ejemplo de 3 por 3 se tenía A, = 0.9, y la salida excedía a la entrada. La producción 
puede continuar. 

Es fácil demostrar lo anterior, una vez que se conoce el hecho principal sobre una ma- 
triz no negativa como A: No sólo el mayor valor característico 1, es positivo, sino que 
también lo es el vector característico x,. Así (1 — A)? tiene el mismo vector característi- 
co, con valor característico 1(1 — A). 

Si A, excede a 1, ese último número es negativo. La matriz (Y — A)” l tomará el vec- 
tor positivo x, como si fuese un vector negativo x,/(1 — A,). En ese caso (Y — A)? defini- 
tivamente no es no negativa. Si 1, = 1, entonces / — A es singular. El caso productivo es 








PORRA IRA ARNO ADRIAN 








EIA 
ARONA RIAL ANNO 





Ejemplo 3 
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A, < 1, cuando las potencias de Á se hacen cero (estabilidad) y la serie infinita] + A + 
A? +... converge. 

Al multiplicar esta serie por / — A se queda con la matriz identidad; todas las poten- 
cias superiores se cancelan, de modo que (7 — A)7* es una suma de matrices no negativas. 
A continuación se proporcionan dos ejemplos: 


A = B Al tiene A; = 2 y se pierde la economía 


ll 


4 dE 2 


1 
0 0 Ñ tiene 41 = 3 y es imposible producir algo. 


En estos casos, las matrices (1 — A)” * son =; E a y E | a 

La inspiración de Leontief fue encontrar un modelo en que se utilizan datos genuinos 
de la economía real. La tabla para 1958 contenía 83 industrias en Estados Unidos, con una 
“tabla de transacciones” de consumo y producción para cada una. La teoría también llega 
más allá de (1 — A)”?, para decidir precios naturales y cuestiones de optimización. Nor- 
malmente, el trabajo está limitado en suministro y debe minimizarse. Y, por supuesto, la 
economía no siempre es lineal. 


Los precios en un modelo entrada-salida cerrado 
El modelo se denomina “cerrado” cuando todo lo que se produce es consumido. Nada sa- 
le del sistema. En ese caso, Á regresa a ser una matriz de Markov. La suma de las colum- 
nas es 1. Podría hablarse sobre el valor del acero, y de los alimentos, y del trabajo, en vez 
del número de unidades. El vector p representa precios, en vez de niveles de producción. 

Suponga que py es un vector de precios. Entonces Apy multiplica los precios por can- 
tidades con la finalidad de proporcionar el valor de cada producto. Este es un nuevo con- 
junto de precios que el sistema utiliza para el siguiente conjunto de valores A*po. La 
pregunta es si los precios tienden al equilibrio. ¿Existen precios tales que p = Ap, y de sis- 
tema conduce a ellos? 

p se reconoce como el vector característico (no negativo) de la matriz A de Markov, 
con A = 1. Este es el estado estacionario po., al que se tiende desde cualquier punto inicial 
Po- Al repetir una transacción una y otra vez, los precios tienden al equilibrio. 


El teorema de “Perron-Frobenius” proporciona las propiedades clave de una matriz 
positiva, que no debe confundirse con una matriz positiva definida, que es simétrica y to- 
dos sus valores característicos son o Se todos los OS a; SON AS 

sk Si 4% es una 2 matriz z positiva, dema 10% es su mayor. ón calacteristicos E > 


todos los demás A Cada componente del vector carac sterístico correspondiente, 


- también « es s positivo. Le 






Demostración Suponga A > 0. La idea clave es considerar todos los números 1 tales que 
Ax = tx para algún vector no negativo x (que no sea x = 0). La desigualdad Ax = £x se de- 
ja para contar con muchos candidatos positivos £. Para el mayor valor fax (que se alcan- 
za), se demostrará que la desigualdad se cumple: Ax = lo 4,X. 

En caso contrario, si Ax > fyg,X no es una igualdad, se multiplica por A. Debido a que 
A es positiva, lo anterior produce una desigualdad estricta A%x > tg, Ax. En consecuencia, 
el vector positivo y = Ax cumple Ay > fmax), Y Ima, hubiera podido ser más grande. Esta 
contradicción obliga a la igualdad Ax = f,4x, y se tiene un valor característico. Su vector 
característico x es positivo (no solamente no negativo) debido a que en el miembro izquier- 
do de esa desigualdad, es seguro que 4x es positivo. 
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Ejemplo 4 


Para ver que ningún valor característico puede ser mayor que fn4x, Suponga que Áz = 
Az. Debido a que tanto A como z pueden implicar números negativos o complejos, se to- 
man valores absolutos: |A]|z] = | Az] < Alz|] por la “desigualdad del triángulo”. Este |z] 
es un vector no negativo, de modo que |A| es uno de los candidatos posibles f. En conse- 
cuencia |A| no puede exceder a A,, que era tonáx: E 


Modelo de von Neumann, de una economía en expansión 
Se regresará a la matriz A de 3 por 3 que proporcionó el consumo de combustible, alimen- 
tos, y trabajo. Si las salidas son s,, f,, £,, entonces las entradas requeridas son 


0.4 0.1 $1 
O SOL 0.5 
A A 


Uy = = Au. 


En economía, ¡la ecuación en diferencias es hacia atrás! En vez de u, = Aug, se tiene Uy = 
Au;. Si A es pequeña (como es el caso), entonces la producción no consume todo, y la eco- 
nomía puede crecer. Los valores característicos de A”? rigen este crecimiento. Pero otra 
vez hay un giro no negativo, ya que el acero, los alimentos, y el trabajo no se presentan en 
cantidades negativas. Von Neumann se preguntó por la razón máxima ? a la que puede cre- 
cer la economía sin dejar de ser no negativa, lo cual significa que u, > tug > O. 

Así, el problema requiere u,; > Au. Es como el teorema de Perron-Frobenius, con 
A en el otro lado. Como antes, la igualdad se cumple cuando + alcanza fax; que es el valor 
característico asociado con el vector característico positivo de A”?. En este caso, el factor 
de expansión es 2. 


] 0.4 0 0.171 f1 0.9 8 
SN y Ax= O 01 08]| I5| = ¡4,5 = 5p* 
5 05 0.7 0.11 15 as| 1] 


Con acero— alimentos —trabajo, en la razón 1-—5—5, la economía crece tan rápido como es 
posible: La razón de crecimiento máxima es VWA,. 





Conjunto de problemas 5.3 


Demuestre que cada tercer número de Fibonacci en O, 1, 1, 2, 3,... es par. 


2.  Bernadelli estudió un escarabajo que “sólo vive tres años, y se reproduce en su tercer 
año”. Estos escarabajos sobreviven el tercer año con probabilidad 3> y el segundo con 
probabilidad 3, y luego producen seis hembras al final de su vida: 


6 
0 
0 


O 
¿a 


Matriz escarabajo A = 


O ni- 


LJ jm 


Demuestre que A* = /, y siga la distribución de 3000 escarabajos durante seis años. 
3. Para la matriz de Fibonacci A = E All calcule 4?, 4?, 4*, Luego, use el texto y una 


calculadora, para encontrar Fo. 





10. 
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Suponga que cada número de “Gibonacci” G;,,, es el promedio de los dos números 
previos, Gt y Gr Entonces Gr+2 => (Gr+1 qe 77): 


Gr+z = 3Gp+1 + 36 Eás E | A dy 
Gre Gia Gr+1 Gr 


a) Encuentre los valores característicos y los vectores característicos de A. 
b) Encuentre el límite cuando n —>00 de las matrices A? = SA?ST!, 
c) Si Gy = 0 y G, = 1, demuestre que los números de Gibonacci tienden a 3. 


Diagonalice la matriz de Fibonacci completando S”!: 
EU da 0 
1.0 Ll O Az 
Realice la multiplicación SA*S”! B para encontrar su segunda componente. Este es 


el k-ésimo número de Fibonacci F; = (Af — 45) /(Ay — 42). 
Los números Af y A% cumplen la regla de Fibonacci Fz+2 = Fir + Fe! 

AA +A y Ao=L +A 
Demuestre lo anterior, usando la ecuación original para los As (multiplíquela por A*). 
Entonces, cualquier combinación de A* y A% cumple la regla. La combinación 
Fi = (A — A%)/(A1 — A2) Proporciona el inicio correcto de Fy =0 y F| = 1. 


Lucas empezó con Ly = 2 y L, = 1. La regla Ly+, = Lr+1 + Ly es la misma, de mo- 
do que A sigue siendo una matriz de Fibonacci. Sume sus vectores característicos 


X1 + X2: 

LO A UE OA O A E A 

+ = “> = = : 

l l 1 1 2 Lo 
Al multiplicar por Af, la segunda componente es L;, = Ai + 2 , Calcule el número 
de Lucas £;p, lentamente aplicando Lx+2 = Ly+, + Lx, y calcule aproximadamente 
con 110, 
Suponga que hay una epidemia en la cual, cada mes la mitad de los sanos enferman y 


la cuarta parte de los enfermos fallecen. Encuentre el estado estacionario para el pro- 
ceso de Markov, correspondiente 


l 
de +1 l 4 0 dy 
E 3 1 
AN E Sk 
wei lo o ¿| lwe 


Escriba la matriz de transición de 3 por 3 para un curso de química que se enseña en 
dos secciones, si cada semana 3 de los de la sección A y 3 de los de la sección B aban- 


donan el curso, y ¿ de cada sección se cambia a la otra sección. 
Encuentre los valores limitantes de y, y Zz (k —> 00) sl 


Yx+1 = 0.8yz + 0.3z% yo =0 
Zi+1 = 0.2 yz + 0.7Zg Zo = 3. 


También, encuentre fórmulas para y, y zz, a partir de A* = SAÉST?, 
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11. a) A partir del hecho de que columna 1 + columna 2 = 2(columna 3), de modo que 


12. 


13, 


14. 


15 


16. 


las columnas son linealmente independientes, encuentre un valor característico y un 
vector característico de A: 


0.2 0.4 0.3 
A=|04 02 0.3 
0.4 04 04 


b) Encuentre los otros valores característicos de A (es una matriz de Markov). 
c) Si uo = (0, 10, 0), encuentre el límite de A“, cuando k > oo. 


Suponga que hay tres centros principales para los camiones Muévalo-Usted-Mismo. 
Cada mes, la mitad de los camiones que están en Boston y en Los Ángeles, van a Chi- 
cago, la otra mitad se queda donde están, y los camiones en Chicago se dividen equi- 
tativamente entre Boston y Los Ángeles. Escriba la matriz de transición A de 3 por 3, 
y encuentre el estado estacionario u,, correspondiente al valor característico A = 1. 


a) ¿En qué rango de a y b está la siguiente ecuación de un proceso de Markov? 


a b 1 
ue == 12, A Uk, uo= |] 


b) Calcule u« = SAFS”* uy para cualesquiera a y b. 
c) ¿En qué condición sobre a y b, u, tiende a un límite finito cuando k —> 00 y cuál 
es el límite? ¿A debe ser una matriz de Markov? 


Empresas multinacionales en América, Asia y Europa poseen bienes por $4 trillones. 
Al principio, $2 trillones están en América y $2 trillones están en Europa. Cada año, 
5 del dinero en América se queda en ese continente, y z se va a Asia y Europa. Para 
Asia y Europa, 5 permanece ahí y 5 se envía a América. 

a) Encuentre la matriz que proporciona 


América Arnérica 
Asia = A ¡Asia 
Europa O Europa E 


b) Encuentre los valores característicos y los vectores característicos de A. 
c) Encuentre la distribución limitante de los $4 trillones, cuando se acaba el mundo. 
d) Encuentre la distribución de los $4 trillones en el año k. 


S1 A es una matriz de Markov, demuestre que la suma de las componentes de Ax es 
igual a la suma de las componentes de x. Deduzca que si Ax = AxconaA % 1l, enton- 
ces la suma de las componentes del vector característico es igual a cero. 

La solución de du/ di = Au = E z (valores característicos i y —1) gira alrede- 
dor de un círculo: u = (cos 1, sen £). Suponga que du/d: se aproxima por diferencias 
hacia adelante, hacia atrás, y centradas F, B, C: 

1) Un+i — Un = AU O Un+i = (1 + 4Mu, (este es el método de Euler). 

(B) un+i — Un = Án+1 0 Un+] = (1 — AY dun (hacia atrás Euler). 

(0) Un+i — Un = ¿Aln+r Tn) O Unas = (7 — LAY + 5A)tn. 


eje pa ==] 
Encuentre los valores característicos de I + A, (1 — A), e (1 — 34) “(1 +34). 
¿Para cuál ecuación en diferencias la solución u,, permanece en un círculo? 






IAÑENSOIOA 


sE 
ES 
ES 
S 


ANDO 


ARAS 


e EA: 
PRINCE 


A a LS RE 









¡PRANO ISTRIA NN CINON ORAR 


; 
| 
| 
E 
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17. ¿Qué valores de «* producen inestabilidad en 9, +; = (UV, + Wa), War = 00, + 0,)? 


18. Encuentre los a, b, c más grandes, para los cuales las siguientes matrices son estables 
o neutralmente estables: 


as 08 b 08St : c 0.8 
0.8 02 | ES 0.2 "6 
19. Multiplique término a término para comprobar que (] — AXI+A+A?+-+..)=/. 
Esta serie representa (Y — A)” ?. Es no negativa cuando A es no negativa, en el supues- 


to de que tenga una suma finita; la condición para esto €S Amas. < 1. Sume la serie in- 
finita, y confirme que es igual a (7 — 4)”?, para la matriz de consumo 


1: AS | 
A=|0 O 1 que tiene Amáx = 0. 
050.0 


20. Para A = E 03) , encuentre las potencias A* (incluyendo A%), y demuestre explícita- 
mente que su suma coincide con (1 — A)7?. 


21. Explique por matemáticas o economía por qué al incrementar la “matriz de consumo” 
A debe incrementarse tmax = A, (y aminorar el desarrollo). 


22. ¿Cuáles son los límites cuando k -—>00 (los estados estacionarios) de lo siguiente? 
Eo 548 B he e E H he sl 
0.6 0,87 1047 0.6 0.8 1" 0.6 0.8] * 
Los problemas 23 a 29 son sobre A = SAST* y Af = SAFSTI, 
23. Diagonalice A y calcule SA*S”! con la finalidad de demostrar esta fórmula para A*: 


Mae O O 
4=|) Aj LaS “(3921 pl 


24. Diagonalice B y calcule SA*S71 con la finalidad de demostrar esta fórmula para B*: 


k ak _ok 
B=|; 3 tiene pul 5 aL 


052 0 Zn 
25. Los valores característicos de A son 1 y 9, y los valores característicos de B son —1 y 
9: 
45 4 1 1 INES 
Pa FO 


Encuentre una matriz raíz cuadrada de A, a partir de R = SY A 57*. ¿Por qué para B 
no existe ninguna matriz raíz cuadrada real? 


26. SiA y B tienen los mismos As con el mismo conjunto completo de vectores caracte- 
rísticos independientes, su factorización en es la misma. Así, A = B. 





27. Suponga que A y B tienen el mismo conjunto completo de vectores característicos, de 
modo que A = SA¡S7T! y L = SA25”*. Demuestre que AB = BA. 


28. a) ¿Cuándo ocurre, que los vectores característicos para 4 = O generan el espacio nu- 
lo N(4)? 
b) ¿Cuándo ocurre, que todos vectores característicos para 1 >* O generan el espacio 
columna C(4)? 
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29. Las potencias de A* tienden a cero si todos los [A/< 1, y se inflan si cualquier |AJ > 
1. Peter Lax proporciona cuatro ejemplos sorprendentes en su libro Linear Algebra. 


3.2 0 E E _ [5 69 
ga [ia] elo »-[: 
141% > 39700 g1024 =] (1024 = -=C ¡11924 y <= 109778 
Encuentre los valores característicos A = e de B y C, para demostrar que B* = I y 
que C? = —J]. 
a 5.4 ECUACIONES DIFERENCIALES Y e”* 


Siempre que se encuentra un sistema de ecuaciones, más que una sola ecuación, la teoría de 
matrices tiene un papel que desempeñar. Para ecuaciones en diferencias, la solución u, = 
Atuo dependía de las potencias de A. Para ecuaciones diferenciales, la solución u(t) = 
e* u(O) depende de la exponencial de A. Para definir esta exponencial, y comprenderla, de 
inmediato se presenta un ejemplo: 
O y du | 
Ecuación diferencial — =Áu = ib: (1) 
dt 11 Z 
El primer paso siempre consiste en encontrar los valores característicos (—1 y —3), así co- 
mo los vectores característicos: 


aif=eol] y ajaj=eo[al 


Luego, varios métodos llevan a u(£). Quizá lo mejor sea hacer coincidir la solución gene- 
ral con el vector inicial u(0) en £ = 0. 

La solución general es una combinación de soluciones exponenciales puras. Estas son 
soluciones de la forma especial ce*x , donde A es un valor característico de A, y x es su 
vector característico. Estas soluciones puras satisfacen la ecuación diferencial, ya que 
didt(ce"x) = Aíce*x). (Fueron la introducción a los valores característicos al inicio 
del capítulo). En este ejemplo de 2 por 2, hay dos exponenciales puras a combinar: 


1 


En el instante cero, cuando las exponenciales son e? = 1, u(0) determina c, y c»: 


—E 
Solución u(t) =cie*"xi + c.ex2 obien, u = ; i hi ¿| al. (2) 
2 


Condición inicial u(O) = C¡Xx¡ + C2Xx7 = F 1] [2] = Sc. 
5 2 


Se reconoce S, la matriz de vectores característicos. Las constantes e = S7*:1(0) son las 
mismas que para las ecuaciones en diferencias. Al sustituirlas de nuevo en la ecuación (2), 
se encuentra que la solución es 


ws lO ¿aja l=s [7 suo. o 


He aquí la fórmula fundamental de esta sección: Se** S”*u(O) resuelve la ecuación dife- 
rencial, justo como SA*S7! ¿y resolvía la ecuación en diferencias: 


u(t) = SeSTiu(0) con A= ú me e Md pa (4) 





Ejemplo 1 


A > 0 a 


A A A AO A AO! 'ONAL 
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a, AE 
. 2 a 


A E. A boi DEL URUGUAY 

Hay dos cosas niás qué facer? con éste Ejériplo. Una es completar el procedimiento 
matemático, proporcionando una definición directa de la exponencial de una matriz. La 
otra es proporcionar una interpretación física de la ecuación y su solución. Se trata del ti- 
po de ecuación diferencial que tiene aplicaciones de utilidad. 

La exponencial de una matriz diagonal A es fácil: ¿4* tiene justo los n números e** 
en la diagonal. Para una matriz general A, la idea natural es imitar la serie de potencias 
e =1+x+:x2/2!1 +x?/3!1 +.-- . Si se sustituye x por Az y 1 por /, esta suma es una 
matriz de n por n: 


"up 
e 
ur 
e 
5d 
dos 
i 
, 
y 

al 

me 

1 

l 

1 

” 

? 

»* 


p z 


Bn PE E ÉOR 


(As (AD? 








Matriz exponencial e =]+At+ iS (5) 
La serie siempre es convergente, y su suma e*' tiene las propiedades idóneas: 
d 
(e eós Es ¿As «q a (ere) q ¡A y raid a Ae*. (6) 


A partir de la última expresión, u(+) = e**u(0) resuelve la ecuación diferencial. Esta solu- 
ción debe ser la misma que la forma Se** $”! y(0) empleada para computación. Para demos- 
trar directamente que estas soluciones coinciden, recuerde que cada potencia (SAS7Y se 
traduce en A* = S A*S7! (debido a que S”? cancela a S). Toda la exponencial es diagonali- 
zada por S: 


201,2 3 0-1,3 
SAS, SAS 
2! 31 


2 3 
es de — a .) sr ae Ser sr! 


'=zI+SAST1 + 





=s(1+a0+ 


En la ecuación (1), la exponencial de Á = le a tiene A = [2 EE 


a l Die 1 5 e o 5 
ó ] 1 ea ] —] y e” ¿goá pa ea . 


En : = 0, se obtiene e” = 7. La serie infinita e** proporciona la respuesta para toda £, aun- 
que es difícil calcular una serie. La forma Se*! 5”! proporciona la misma respuesta cuan- 
do es posible diagonalizar a A: se requieren n vectores característicos independientes en S. 
Esta forma más sencilla, lleva a una combinación de n exponenciales e*“x, que es la mejor 
solución de todas: 





Las constantes c, que cumplen las condiciones iniciales (0) son c = SS uCO). 
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Lo anterior proporciona una analogía completa con las ecuaciones en diferencias y 
SAS” uo. En ambos casos se supuso que era posible diagonalizar a A, ya que en caso con- 
trario posee menos de n vectores característicos y no se han encontrado suficientes solucio- 
nes especiales. Las soluciones que faltan existen, aunque son más complicadas que las 


E 
= 
= 

z 
€ 
> 
Z 
z 
É 
Z= 


ALADO INV! 


Demostración rápida de que e** es invertible: Simplemente reconozca e” ** como su in- 


versa. 

Esta invertibilidad es fundamental para las ecuaciones diferenciales. Si n soluciones 
son linealmente independientes en £ = O, son linealmente independientes por siempre. Si 
los vectores iniciales son vy,..., Y,, entonces las soluciones e*'y pueden escribirse en una 
matriz: 


exponenciales puras e*x. Implican “vectores característicos generalizados” y factores co- ! 
mo te”. (Para calcular este caso defectuoso, puede usarse la forma de Jordan que se mues- : 
tra en el apéndice B, y encontrar e%). La fórmula u(£) = e*“u(0) sigue siendo com- i 
pletamente correcta. E 
La matriz e* nunca es singular. Una demostración consiste en considerar sus valo- : 

res característicos; si A es un valor característico de A, entonces e**' es el valor característi- a 
co correspondiente de e“, y e" jamás puede ser cero. Otro método es calcular el i 
determinante de la exponencial: E 
det ea EN gai ha O ph po gaaza(An (9) l 





[et y, e. ey,] =e* [v, ... Un]. 


El determinante del miembro izquierdo es el wronskiano. Éste nunca es cero, ya que es el 
producto de dos determinantes diferentes de cero. Las dos matrices en el miembro derecho 
son invertibles. 


Observación No todas las ecuaciones diferenciales se presentan como un sistema de pri- 
mer orden du/dt = Au. Es posible empezar, a partir de una simple ecuación de orden supe- 
rior, como y” -—3y” +2y” = 0, Para convertir lo anterior en un sistema de 3 por 3, se 
introducen v = y? y w = v' como incógnitas adicionales, junto con y misma. Luego, estas 
dos ecuaciones se combinan con la original para obtener u” = Au: 


y =u 0 1570 y 
vv =u obien, u'= |0 6 | vl = Au. 
w' = 3w — 2u O —2 3 vw 


De nuevo, se ha regresado a un sistema de primer orden. El problema puede resolverse 
de dos formas. En un curso de ecuaciones diferenciales, y = e” se sustituiría por 
E e 3y" de 2y' = (: 


(?-312+24e" =0 obien, AM DA -—2Je* =0. (10) 


Las tres soluciones exponenciales puras son y = e*%, y = e”, y y = e”. No está implicado 
ningún vector característico. En un curso de álgebra lineal, se encuentran los valores carac- 
terísticos de A: 


—A 1 0 
det(A —AL) = 0D A 1 = —17 + 312 — 24 =0. (1D) 
0 -2 3-14 


¡Las ecuaciones (10) y (11) son las mismas! Aparecen los mismos tres exponentes: A = 0, 
A =1,y 4 = 2. Esta es una regla general que hace consistentes a los dos métodos; las ra- 
zones de crecimiento de las soluciones permanecieron fijas cuando las ecuaciones cambia- 
ron de forma. Nos parece que resolver la ecuación de tercer orden es más rápido. 
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La importancia física de du/ dt = de E es fácil de explicar, y al mismo tiempo 


es realmente importante. Esta ecuación diferencial describe un proceso de difusión. 







concentración 0 


E Ea ER E Ea 


Figura 5.1 Modelo de difusión entre cuatro segmentos. 


Divida un tubo infinito en cuatro segmentos (véase la figura 5.1). En el instante + = O, los 
segmentos de en medio contienen concentraciones v(0) y w(0) de un producto químico, En 
cada instante t, la razón de difusión entre dos segmentos adyacentes es la diferencia en 
concentraciones. Dentro de cada segmento, la concentración permanece uniforme (cero en 
los segmentos infinitos). El proceso es continuo en el tiempo pero discreto en el espacio; 
las incógnitas son v(í) y w(t) en los dos segmentos interiores S, y S». 

La concentración v(t) en S, cambia de dos formas. Hay una difusión hacia Sy, y hacia 
o fuera de S,. La razón de cambio neta es dv/dt, y dw/dt es semejante: 


du 


l haci a 
Caudal hacia $; eE 


= (w — 1) + (0 — y) 


Caudal hacia $, e = (0 — w) + (uv — w). 


Esta ley de difusión coincide exactamente con nuestro ejemplo du/dt = Au: 

u= |», S la JE 

w di Y 2 1 a 
Los valores característicos — 1 y —3 rigen la solución, y proporcionan la razón de que se 
desintegra la concentración, y A, es el más importante porque sólo un conjunto excepcio- 
nal de condiciones puede conducir a “superdesintegración” a la razón e”*, De hecho, es- 
tas condiciones deben provenir del vector característico (1, —1). Si el experimento sólo 
admite concentraciones no negativas, es imposible y la razón limitante debe ser e””*. La so- 
lución que se desintegra a esta razón más lenta, corresponde al vector característico (1, 1). 
En consecuencia, las dos concentraciones se vuelven casi iguales (lo cual es típico de la di- 

fusión) cuando f —>00. 
Un comentario adicional sobre este ejemplo: Se trata de una aproximación discreta, con 
sólo dos incógnitas, para la difusión continua descrita por esta ecuación diferencial parcial: 
du 9? 


E ión del cal E RÁ, 
cuación del calor a 


Esa ecuación del calor es aproximada, al dividir el tubo en segmentos cada vez más peque- 
ños, de longitud 1/N. El sistema discreto con Y incógnitas está regido por 


1 O | Aun. (12) 
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Esta es la matriz en diferencias finitas con el patrón 1, —2, 1. El miembro derecho de Au 
tiende a la segunda derivada d?u/dx?, luego que un factor de escala N? se presenta del pro- 
blema de flujo. En el límite cuando N —> 00, se llega a la ecuación del calor 3u/lat = 
324/89 x?. Sus soluciones siguen siendo combinaciones de exponenciales puras, aunque 
ahora hay una infinidad. En vez de vectores característicos de Ax = Ax, se tienen funcio- 
nes características de dul dx? = lu. Éstas son u(x) = sen narx con 4 = —n?*77?. Así, la 
solución de la ecuación del calor es 


oo 
PA y 
ult) = > cne ””*sennrx. 


Las constantes c, están determinadas por la condición inicial. La novedad es que los vec- 
tores característicos son funciones de u(x), ya que el problema es continuo y no discreto. 


Estabilidad de las ecuaciones diferenciales 


Así como para las ecuaciones en diferencias, los valores característicos deciden cómo se 
comporta u(t) cuando t > oo. En la medida en que sea posible diagonalizar a A, hay n so- 
luciones exponenciales puras de la ecuación diferencial, y cualquier solución específica 
u(t) es alguna combinación 


u(i) = se” Ss” uo = cietx, ooo +cre"x,. 


La estabilidad está regida por estos factores e*". Si todos ellos tienden a cero, entonces u(£) 
tiende a cero; si todos están acotados, entonces u(t) permanece acotado; si uno de ellos se 
infla, entonces excepto por condiciones iniciales muy especiales la solución se infla. Ade- 
más, el tamaño de e” sólo depende de la parte real de A. Lo único que rige la estabilidad 
son las partes reales de los valores característicos: si A = a + 1b, entonces 


Atl at _ibt 


e" =e e" =e(cosbt + isenbt) y la magnitud es Je"| = e” 


Lo anterior se desintegra para a < 0, es constante para a = 0, y explota para a > 0. La par- 
te imaginaria produce oscilaciones, aunque la amplitud proviene de la parte real. 





neutr Ernd estable cuando toda Red Ss 0 Rea; = = 0, € 
inestable y Y ets no está a acotado, si cualquier valor característico tiene Re dz a >, 





ENS 





EN 
ds eto AREA ; RRE 








En algunos textos, la condición Re A< O se denomina estabilidad asintótica, porque garan- 
tiza desintegración para grandes instantes /. Nuestro razonamiento dependía de contar con 
n soluciones exponenciales puras, pero incluso si A no es diagonalizable (y haya términos 
como te”) el resultado sigue siendo cierto: todas las soluciones tienden a cero si y sólo si 
todos los valores característicos tienen Re 1< 0, 

La estabilidad es especialmente fácil de decidir para un sistema de 2 por 2 (que es muy 
común en aplicaciones). La ecuación es 


du ola ib 
e A 
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y es necesario saber cuándo, ambos valores característicos de esta matriz tienen partes rea- 
les negativas. (Observe nuevamente que los valores característicos pueden ser números 
complejos). Las pruebas de estabilidad son 


la traza a + d debe ser negativa. 





el determinante ad — bc debe ser positivo. 


Cuando los valores característicos son reales, estas pruebas garantizan que son negativos. 
Su producto es el determinante; es positivo cuando los valores característicos tienen el mis- 
mo signo. Su suma es la traza; es negativa cuando ambos valores característicos son nega- 
tivos. 

Cuando los valores característicos son un par complejo x + ly, las pruebas siguen te- 
niendo éxito. La traza es su suma 2x (que es < 0) y el determinante es (x + ¿yx — iy) = 
12 + y? > 0. En la figura 5.2 se muestra el cuadrante estable, la traza < O y el determinan- 
te > O. También se muestra la línea fronteriza parabólica entre los valores característicos 
reales y complejos. La razón de la parábola se encuentra en la ecuación cuadrática para los 
valores característicos: 


a-—=A b EE RN Eee 
det | 4 e Ñ =1 (trazajA + (det) = 0. (13) 


La fórmula cuadrática para A conduce a la parábola (traza)? = 4(det): 


Ad 5 [traza + y (traza)? — 4(det) ]. (14) 


Arriba de la parábola, el número en el radicando es negativo, de modo que A. no es real. So- 
bre la parábola, la raíz cuadrada es cero y A es repetido. Debajo de la parábola, las raíces 
cuadradas son reales. Toda matriz simétrica tiene valores característicos reales, ya que si 
b = Cc, entonces 


(traza)? — 4(de) = (a + dy? — 4ad — db?) = (a — dy? + 4b* > 0. 


Para valores característicos complejos, b y c tienen signos opuestos y son suficientemente 
grandes. 


determinante D 


Ai =42 
Ss ES y 
E , T2 =4D 
" ambos Rei <0 ambos ReA>0  / 
” estables inestables PS 
$ valores ES 
“scaracteristicos | complejos  ,- 
ambosi<0 e” ambosA>0 
reales y estables '*, _.” reales e inestables 


traza T 





det < 0 proporciona 11 < 0 y A2 > 0: reales e inestables 


Figura 5.2 Regiones de estabilidad e inestabilidad para una matriz de 2 por 2. 
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Ejemplo 2 


Ejemplo 3 


Uno de cada cuadrante: sólo +2 es estable: 


RETA 


Sobre las fronteras del segundo cuadrante, la ecuación es neutralmente estable. Sobre el eje 
horizontal, un valor característico es cero (porque el determinante es 1,42 = 0). Sobre el 
eje vertical arriba del eje, ambos valores característicos son puramente imaginarios (por- 
que la traza es cero). Cruzando estos ejes están las dos formas en que se pierde la estabilidad. 


El caso de n por n es más difícil. Una prueba para Re 1¿< 0 se debe a Routh y Hur- 
witz, quienes encontraron una serie de desigualdades sobre los elementos a,;. No creo que 
este método sea demasiado bueno para una matriz grande; quizá la computadora encuen- 
tre los valores característicos con mayor certidumbre de los que puede probar tales desi- 
gualdades. La idea de Liapunov fue encontrar una matriz de ponderación W tal que la 
longitud ponderada ||Wu(t)|| siempre es decreciente. Si existe una W así, entonces ||Wid| de- 
crece de manera estable a cero, y después de algunos altibajos u también debe llegar ahí 
(estabilidad). El verdadero valor del método de Liapunov, se encuentra para una ecuación 
no lineal; entonces la estabilidad puede demostrarse sin necesidad de conocer una fórmula 
para ut). 


du/fdi = | > El u manda a u(t) alrededor de un círculo, empezando desde (0) = (1, 0). 
Debido a que traza = O y det = 1, se tienen valores característicos puramente imaginarios: 


e EA 


Los vectores característicos son (1, —1) y (1, 1), y la solución es 


A 
A mE El 


Lo anterior es correcto pero no es elegante. Al sustituir cos f + i sen 1 para e” y e”*, vuel- 
ven a aparecer números reales: la solución circulante es u() = (cos £, sen 1). 
Empezando desde una u(0) = (a, b) distinta, la solución u(t) termina como 


a B cos! Pre a joo —sen A Bl (15) 


de | = + 1=0 de modo que A=+i y —1 


bcosít + asent sen í cos £ 


¡Aquí se tiene algo importante! La última matriz multiplica a (0), por lo que debe ser la 
exponencial e”, (Recuerde que u(£) = e*u(0).) Esta matriz de senos y cosenos es nuestro 
ejemplo principal de una matriz ortogonal. La longitud de las columnas es 1, su producto 
interno es cero, y se tiene una confirmación de un hecho maravilloso: 


Si A es simétrica sesgada (A* = —A) entonces e** es una matriz ortogonal. 


A* = —A proporciona un sistema conservador. En amortiguamiento o difusión no se pier- 
de energía: 


. let 








: AS ETA 
PARARON SIARRSASRAN ORO VINO colega a 





Ejemplo 4 


Ejemplo 5 


Ejemplo 6 
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La última ecuación expresa una propiedad esencial de las matrices ortogonales. Cuando 
multiplican a un vector, la longitud no cambia. El vector (0) simplemente rota, y eso des- 
cribe la solución de du/di = Au: se desplaza alrededor de un círculo. 

En este caso bastante poco común, e* también puede reconocerse directamente, a par- 
tar de la serie infinita. 


Observe que A = E El tiene 4? = —/, lo cual se aplica en la serie para e”: 


¡e oO : 
(AL? A 2 6 


+ At+ —— + 
2 6 p? a ) 
lo e > la rs 

6 2 


pp il  —sen Í 





pr 


senf cosi 


La ecuación de difusión es estable: Á = de E] tiene 4 = —1y4= 3, 


Si los segmentos infinitos se cierran, nada puede escapar: 


du _|-1 1 
O 


dvu/jdi =w— uy 


E o bien. AR 


Este es un proceso de Markov continuo. En vez de moverse cada año, las partículas se mue- 
ven a cada instante. Su número total v + w es constante. Esto se debe al hecho de sumar 
dos ecuaciones en el miembro derecho: la derivada de v + w es cero. 

Una matriz de Markov discreta tiene la suma de sus columnas igual a Amáx = 1. Una 
matriz de Markov continua, para ecuaciones diferenciales, tiene la suma de sus columnas 
igual a Amáax = 0. A es una matriz de Markov discreta si y sólo si B = A — Tes una matriz 
de Markovy continua. El estado estacionario para ambas es el vector característico para 
Amáx- Se multiplica por 1* = 1 en ecuaciones en diferencias y por e” = 1 en ecuaciones di- 
ferenciales, y no se mueve. 

En el ejemplo, el estado estacionario tiene v = w. 


En ingeniería nuclear, un reactor se denomina crítico cuando es neutralmente estable; la fi- 
sión equilibra la desintegración. Una fisión más lenta lo hace más estable, o subcrítico, y 
finalmente se desmantela. La fisión inestable es una bomba. 


Ecuaciones de segundo orden 


Las leyes de difusión llevaron a un sistema de primer orden du/dt = Au. Así lo hacen tam- 
bién muchas otras aplicaciones en química, biología, y otras áreas, aunque la ley más im- 
portante de la física no lo hace. Se trata de la ley de Newton F = ma, y la aceleración a es 
una segunda derivada. Los términos inerciales producen ecuaciones de segundo orden (es 
necesario resolver d “u/dí? = Au en vez de du/dt = Au), y el objetivo es entender cómo es- 
te giro a segundas derivadas modifica la solución.” En álgebra lineal es opcional, pero no 
es así en física. 


“Las cuartas derivadas también son posibles, en la flexión de vigas, aunque la naturaleza parece resistir si se pa- 


sa a derivadas superiores a aquéllas. 
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La comparación es perfecta si se preserva la misma A: 


757 a 1 ! 
au =| : Es A (16) 


Dos condiciones iniciales inician el sistema: el “desplazamiento” u(O) y la “velocidad” 

u'(0). Para cumplir estas condiciones, hay 2n soluciones exponenciales puras. - ¿ 
Suponga que se usa w en vez de A, y que estas soluciones especiales se escriben co- : 

mo u = e'x, Al sustituir esta exponencial en la ecuación diferencial, debe cumplir 


Z 


E | 
qe x) = Alex), obien, —w%x = Ax. 17) 


El vector x debe ser un vector característico de A, exactamente como antes. Ahora el va- 
lor característico correspondiente es —e”, de modo que la frecuencia w está relacionada 
con la razón de desintegración A mediante la ley —w? = A. Toda solución especial e*x de 
la ecuación de primer orden lleva a dos soluciones especiales e'”x de la ecuación de se- 
gundo orden, y los dos exponentes son w = +./—A. Lo anterior sólo fracasa cuando 1 = 
O, que sólo tiene una raíz cuadrada: si el vector característico es x, entonces las dos solu- 
ciones especiales son x y tx. 

Para una matriz de difusión genuina, todos los valores característicos A son negativos 
y todas las frecuencias «w son reales: la difusión pura se transforma en oscilación pura. Los 
factores e'“* producen estabilidad neutra, la solución no crece ni se desintegra, y la ener- 
gía total permanece precisamente constante. Simplemente continúa pasando alrededor del 
sistema. La solución general de d?u/di? = Au, si A tiene valores característicos negativos 


Arc An SI +] TA ES 
U(E) = (ce + de Da + + (ce + de xr, (18) 
Como siempre, las constantes se encuentran a partir de las condiciones iniciales. Esto es 


más fácil de hacer (a expensas de una fórmula adicional) cambiando de exponenciales os- 
cilatorias a las funciones seno y coseno más conocidas: 






a Mo: Es RRA TEO, 


basan (19) 





po LU ms 
de pe 
> pd 
PERA US É 
A. ; 
A 
ñ e e E 


de 
Nr 
Fai Y 


A Ls SA os 7 e Petr E 
O , AS A AS SPA OS ET ES . te EN 


El desplazamiento inicial u(0) es fácil de mantener separado: í = O significa que sen wt = 
O y cos wi = 1, dejando sólo 


u(O) = a1x1 + :** + 4xXa, obien, u(0) =Sa, obien, a =S"*u(0). 


Luego de diferenciar u(t) y hacer £ = O, las bs se determinan por la velocidad inicial: 
(O) = bioxy + :** + b,0rXn. La ecuación se resuelve al sustituir las as y las bs en la 
fórmula para u(t). 

La matriz A = a E tiene A, = —1 yA, = —3. Las frecuencias son w, = 1 y 
wm) =/3. Si el sistema inicia desde el reposo, u'(0) = O, los términos en b sen wt desapa- 
recen: 


1 
Solución de u(0) = A u(t) = 3 COS t H + > cos /3t de ; 


Físicamente, dos masas están unidas entre sí y a paredes estacionarias mediante tres 
resortes idénticos (véase la figura 5.3). La primera masa se mantiene a v(0) = 1, la segun- 
da se mantiene a w(0) = O y en £ = O se libera. Su movimiento u(t) se convierte en un pro- 
medio de dos oscilaciones puras, correspondientes a los vectores característicos. En el 
primer modo x, = (1, 1), las masas se mueven juntas y el resorte en el medio jamás se es- 
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aj) ww =1, 131 = H 


Figura 5.3. Los modos de oscilación rápida y lenta. 


tira (véase la figura 5.3a). La frecuencia w, = l es la misma que para un solo resorte y 
una sola masa. En el modo más rápido x, = (1, —1) con frecuencia «/3 , las masas se mue- 
ven de manera opuesta pero a la misma velocidad. La solución general es una combina- 
ción de estos dos modos normales. La solución particular es la mitad de cada una. 

A medida que transcurre el tiempo, el movimiento es “casi periódico”. Si la razón w,/w, 
fuese una fracción como 2/3, las masas terminarían por volver a u(0) = (1, 0) y empezarían 
de nuevo. Una combinación de sen 2f y sen 31 tendría un periodo de 271. Sin embargo, 4/3 
es irracional. Lo mejor que puede decirse es que las masas estarán arbitrariamente próximas 
a (1, 0) y también a (0, 1). Como una bola de billar que rebota por siempre en una mesa per- 
fectamente lisa, la energía total es fija. Tarde o temprano las masas llegan cerca de cualquier 
estado con esta energía. 


De nuevo es imposible dejar el problema sin establecer un paralelismo con el caso 


continuo. A medida en que las masas y los resortes discretos se unen en una varilla sólida, 
las “segundas diferencias” dadas por la matriz A 1, —2, 1 se convierten en segundas deri- 
vadas. Este límite es descrito por la célebre ecuación de onda 32u/9t? = 924 /9x?. 


Conjunto de problemas 5.4 


1. Siga el primer ejemplo de esta sección, para encontrar los valores característicos y los 
vectores característicos, así como la exponencial e”*, para 


=1 1 
a= (A 11 


2. Para la matriz previa, escriba la solución general de du/di = Au, así como la solución 
específica que coincida con u(0) = (3, 1). ¿Cuál es el estado estacionario cuando 
t > 007? (Este es un proceso de Markov continuo; 4 = O en una ecuación diferencial 
corresponde a A = 1 en una ecuación en diferencias, ya que e* = 1.) 


3. Suponga que la dirección temporal se invierte para obtener la matriz —A: 


da _[ 1 -1 _[3 
TOO =t eE con uo 88 


Encuentre u(f) y demuestre que se infla en vez de desintegrarse cuando £ —> 00. (La 
difusión es irreversible, y la ecuación del calor no puede aplicarse en retrospectiva.) 





| 
| 
| 
| 
] 
| 
| 
| 
| 
q 
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4. 


10. 


11. 


Si P es una matriz proyección, a partir de la serie infinita demuestre que 


e? =1+1.718P. 


Una matriz diagonal como A = | . a satisface la regla de costumbre e%“+D = ¿MgA? 


ya que la regla se cumple para cada elemento diagonal. 
a) Explique por qué e* '+D) =¿*%t¿A7 usando la fórmula e*' = Set S71. 
b) Demuestre que e**B = ¿428 no se cumple para matrices a partir del ejemplo 


0 0 O —1i 20 Ñ 
A = $ a B == o 5 (utilice la serie para e! y e) 


La ecuación de orden superior y” + y = O puede escribirse como un sistema de pri- 
mer orden si la velocidad y* se introduce como otra incógnita: 


El 


Si ésta es du/dt = Au, ¿cuál es la matriz A de 2 por 2? Encuentre sus valores caracterís- 
ticos y sus vectores característicos, y calcule la solución que empieza desde y(0) = 2, 
050. 


Transforme y” = O a un sistema du/dt = Au de primer orden: 
all O Dl 
dt ly 0 O Ol al 


Esta matriz A de 2 por 2 sólo tiene un vector característico y no es posible diagonali- 
zarla. Calcule e*, a partir de la serie l + At + - - * y escriba la solución e*'(0) empe- 
zando desde y (0) = 3, y'(0) = 4. Compruebe que su (y, y”) satisface y” = 0. 


Suponga que la población de conejos » y la población de lobos w están regidas por 


dr 

— =4r—2 
2 r w 
a 
di F 


a) Este sistema es ¿estable, neutralmente estable o inestable? 
b) Si inicialmente r = 300 y w = 200, ¿cuáles son las poblaciones en el instante 1? 
c) Al cabo de bastante tiempo, ¿cuál es la proporción de conejos a lobos? 


Decida la estabilidad de u' = Au para las siguientes matrices: 


e e (la Z 
a) a= "7 a b) a=|, e 


od 1 0 a 
a a=|| de d) 4a=|7 al 
Decida la estabilidad o inestabilidad de dv/dt = w, dw/d: = v. ¿Existe una solución 
que se desintegre? 


Con base en su traza y su determinante, ¿en qué instante t las siguientes matrices cam- 
bian entre estables con valores característicos reales, estables con valores característi- 
cos complejos e inestables? 


Le 10 4 E Sl 
4 = |) es! 42 = |; el 4 =|; a: 








12, 


ES: 


14, 


15, 


16. 


17, 


18. 


19, 


20. 
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Encuentre los valores característicos y los vectores característicos para 


dú O 3 0 
a 5 O 4lu. 
y O =4 0 


¿Por qué se sabe, sin necesidad de calcular, que e? es una matriz ortogonal y que 
lu(o ? = ul + ul + u3 es constante? 


Para la ecuación simétrica sesgada 


du 0 C —b 41 
E = Au = | -c 0 a la |, 
á b —a 0 U3 


a) Escriba u', u>z, 7 y confirme que 4/41 + u5uz + 4443 =0, 
b) Deduzca que la longitud u% + u2 + u2 es una constante. 


c) Encuentre los valores característicos de A. 
La solución gira alrededor del eje w = (a, b, c), porque Au es el “producto cruz” y X 
w, que es perpendicular a u y w. 


¿Cuáles son los valores característicos A y las frecuencias w, así como la solución ge- 
neral de la siguiente ecuación? 
0 E. , 
A a E 


Resuelva la ecuación de segundo orden 


== 3» 0d «co, = || y uo = (e: 


En la mayor parte de las aplicaciones, la ecuación de segundo orden se ve como Mu”+ 
Ku = 0, con una matriz masa que multiplica a las segundas derivadas. Sustituya la ex- 
ponencial pura u = e'x y encuentre el “problema de valores característicos gene- 
ralizado” que es necesario resolver para la frecuencia w y el vector x. 


du 
di? 


deu 
de 


Con una matriz fricción F en la ecuación u” + Fu' — Au = 0, sustituya una exponen- 
cial pura u = e*'x, y encuentre un problema de valor característico cuadrático para A. 


Para la ecuación (16) en el texto, con w = 1 ./3, encuentre el movimiento si la pri- 
mera masa se golpea en £ = 0; u(0) = (0, 0) y u'(0) = (1, 0). 


Toda matriz de 2 por 2 con traza cero puede escribirse como 


E a DTO 
a= ll, —a L 


Demuestre que sus valores característicos son reales exactamente cuando a+ 

DES: 

Por sustitución hacia atrás o calculando los vectores característicos, resuelva 
A 1 


0 3 6ju con u(0)= ¡0 
0.004 1 
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21. 


22. 


23. 


24, 


25, 


26. 


27. 


- 


Encuentre los As y los xs de modo que e”“x resuelva 
du 14 3 
di UE 


Al Aat 


¿Qué combinación u = cre" x, + c2e* x9 empieza desde u(0) = (5, —2)? 


Resuelva el problema 21 para u(% = (y(2), z(£)) por sustitución hacia atrás: 


Primero se resuelve = z, empezando con z(0) = —2. 


dt 
d 
Luego se resuelve 7 = 4y + 3z, empezando con y(0) = $. 


La solución para y es una combinación de e” y e”. 


Encuentre A para cambiar y” = 5y"+ 4y en una ecuación vectorial para u(£) = (y(0), 


ym): 
A E A 
di MA | | M úl 


¿Cuáles son los valores característicos de A? Encuéntrelos también por sustitución de 
y = el en la ecuación escalar y” = 5y'+ 4y. 


Entre dos habitaciones con aforo para v(0) = 30 personas y w(0) = 10 personas se 
abre una puerta. El movimiento entre las habitaciones es proporcional a la diferencia 
UNS ap: 

— =Y—wuv — =Y—4Y. 

di o di 


Demuestre que el total v + w es constante (40 personas). Encuentre la matriz en 
duldí = Au, así como sus valores característicos y vectores característicos. ¿Cuáles 
son vywent= 1? 
Invierta la difusión de personas en el problema 24 a du/dt = —Au: 

du a dw 

— =y= — =Y—y. 

dt di 
El total v + w sigue siendo constante. ¿Cómo cambian los As ahora que A ha cambia- 
do a —A? Sin embargo, demuestre que v(t) tiende a infinito a partir de v(0) = 30, 


La solución de y” = O es una recta y = C + Dt. Transfórmela en una ecuación matricial: 


Ss Ml = P o! HA tiene la solución p Í = ¿M | dea! 


Esta matriz A no puede diagonalizarse, Encuentre A? y calcule e =1 + Ar + 1422? 
+ + +». Multiplique su e* por (y(0), y'(0)) para comprobar la recta y(t) = y(0) + y"(0)z. 


Sustituya y = e en y” = 6y” — 9y para demostrar que A = 3 es una raíz repetida. Es- 
to es un problema: se requiere una segunda solución después de e”. La ecuación ma- 


tricial es 
O O dE 
dt (y! A y 


Demuestre que esta matriz tiene A = 3, 3 y sólo una recta de vectores característicos. 
Aquí también se tiene un problema. Demuestre que la segunda solución es y = te”. 





0 A e o a ANA AE 


a 0 "mo. o. E «q e 0) 10Qy ur» "af * US —-” ue Tr Aa? 2 CR ha Y 
z 


divivErna=a 
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28. Imagine cómi0r a by Anciane como una ecuación vectorial Mu' = Au. 

29. a) Encuentre dos funciones CERO e resuelvan la ecuación d*y/d = —y. ¿Cuál 
empieza con y(0) = 1 y y'(0) = 
b) La ecuación de segundo orden e = —y produce una ecuación vectorial u' = Au: 


ly O e E 
ú M di Mi E o) M ds 


Escriba y (+) del inciso a) en u(£) = (y, y”). Esto resuelve nuevamente el problema 6. 


30. Una solución particular de du/dt = Au — bes u, = A”*b, si A es invertible. Las solu- 
ciones de du/dt = Au dan u,. Encuentre la solución completa u, + u, de 


au... pa du 0, 8 
Gr e 


31. Sic no es un valor característico de A, sustituya u = ev, y encuentre v para resolver 
duldt = Au — e“b, Esta u = ev es una solución particular. ¿Cómo fracasa cuando c 
es un valor característico? 


32. Encuentre una matriz A para ilustrar cada una de las regiones inestables en la figura 
iZ: 
a) A¡<O0 y As >0. 
b) Aj >0yi>0. 
c) As complejos con parte real q > O. 


Los problemas 33 a 41 son sobre la matriz exponencial e** 


33. Escriba cinco términos de la serie infinita para e*, Tome la derivada £ de cada término. 
Demuestre que tiene cuatro términos de Ae*, Conclusión: e*'u (0) resuelve u' = Au. 


34. La matriz B = | . ol tiene B* = O. Encuentre e**, a partir de una serie infinita 
(corta). Compruebe que la derivada de e? es Be?*, 


35. Empezando desde u(0), la solución en el instante T es e*Ty(0). Pase a un instante adi- 
cional £ para llegar a e*(e**4(0)). Esta solución en el instante £ + T también puede es- 
cribirse como . Conclusión: e** multiplicado por e*” es igual a 


36. Escriba A = É al en la forma SAS”!, Encuentre e**, a partir de Se**S”!, 


37. Si A? = A, demuestre que la serie infinita produce e** = ] + (e! — 1)A. Para A = 


ño | en el problema 36, con lo anterior se obtiene e** = 





38. En general, e*e? es diferente de e*e*, y ambas son distintas de e***, Compruebe esto, 
usando los problemas 36-37 y 34: 


E de AOL O 
A=|> . B=|0 él A+B=|) A, 
39. Escriba Á = E a como SAS”!, Multiplique Se%**S”7! para encontrar la matriz 


exponencial e*. Compruebe que e* = / cuando £ = 0. 
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40. Escriba A = F y en la serie infinita para encontrar e”. Primero calcule A?: 


eli Je] 


41. Proporcione dos razones por las cuales la matriz exponencial e** nunca es singular. 
a) Escriba su inversa. 
b) Escriba sus valores característicos. Si Ax = Ax, entonces ex = Da 





IAN 


42. Encuentre una solución x(2), y(t) del primer sistema que se haga grande cuando t —>-00. 
Para evitar esta inestabilidad, ¡un científico consideró intercambiar las dos ecuaciones! 


dx/dt = 0x —4y iS dy/di = —2x +2y 
i 
dy/dt = —2x + 2y dx/di = 0x —4y. 
Así, la matriz | Es 24 | es estable. Tiene ¿< 0. Comente esta locura. 


43. A partir de esta solución general de du/d: = Au, encuentre la matriz A: 


u(t) = ce? A + cre” A 


dl 5.5 MATRICES COMPLEJAS 


Ya no es posible trabajar sólo con vectores y matrices reales. En la primera parte de este li- 
bro, cuando el problema básico era Ax = b, la solución era real cuando A y b eran reales. Hu- 
biera sido posible permitir números complejos, aunque eso no hubiera contribuido a nada. 
Ahora ya no es posible evitarlos. Una matriz real tiene coeficientes reales en det (4 — AD), 
aunque los valores característicos (como en las rotaciones) pueden ser complejos, 

A continuación se introduce el espacio C” de vectores con n componentes complejas. 
La suma y la multiplicación matriciales obedecen las mismas reglas que antes. La longitud 
se calcula de otra forma. Como se hacía antes, el vector en C? con componentes (1, ¿) po- 
día tener longitud cero: 12+ 2 = 0, lo cual no está bien. La longitud al cuadrado correcta es 
12+ 1? =2, 

Este cambio a |x]1? + |x,1? + - + - + |x,]? obliga a toda una serie de cambios. El pro- 
ducto interno, la traspuesta, las definiciones de matrices simétrica y ortogonal, todo esto 
debe modificarse para números complejos. Las nuevas definiciones coinciden con las 
viejas cuando los vectores y matrices son reales. Estos cambios se presentan en una lista al 
final de la sección, y cada cuestión se explica en la medida en que se aborda. 

Esa tabla es virtualmente un diccionario para pasar de real a complejo. Esperamos que 
sea de utilidad para el lector. En particular, se desea incursionar en las matrices simétricas 
y en las matrices hermitianas. ¿Dónde están sus valores característicos, y qué hay de es- 
pecial sobre sus vectores característicos? Para efectos prácticos, estas son las cuestiones 
más importantes en la teoría de los valores característicos. De antemano se solicita aten- 
ción para las respuestas: 


1. Toda matriz simétrica (y toda matriz hermitiana) tiene valores característicos 


reales. 
2. Sus vectores característicos pueden escogerse de modo que sean ortonormales. 





Aunque parezca extraño, para demostrar que los valores característicos son reales se em- 
pieza con la posibilidad opuesta, que lleva a números complejos, vectores complejos y ma- 
trices complejas. 
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Números complejos y sus conjugados 


Quizá el lector ya tenga experiencia con los números complejos; es fácil proporcionar un re- 
paso. Los conceptos importantes son el conjugado complejo x y el valor absoluto |x|. Todo 
mundo sabe que, no importa qué sea i, si éste cumple la ecuación ¿ 2 = —]. Se trata de un 
número imaginario puro, como lo son sus múltiplos ¿b; b es real. La suma a + ¿bes un nú- 
mero complejo, que se grafica de forma natural en el plano complejo (véase la figura 5.4). 


eje imaginario 


19 


eje real 





| 
i 
1 
] 
t 
Í 
É 
| 
| 
1 
] 
i 
( 


¡; conjugado complejo 
a—-ib=a+1b=re"* 





9 





Figura 5.4 El plano complejo, con a + ib = re? y su conjugado a — ib = re”*, 


Los números reales a y los números imaginarios ¿b son los casos especiales de los nú- 
meros complejos; están sobre los ejes. La suma de dos números complejos es fácil: 


Suma de números complejos (a + ¿b) + (c +¿d) = (a +c) +1(b + d). 
Al multiplicar a + ib por c + id se aplica la regla de que ¡? = —1: 


Multiplicación (a + ibKc + id) =ac + ibc + iad + i?bd 
= (ac — bd) + ilbc + ad). 


El conjugado complejo de a + ib es el número a — ib. Se invierte el signo de las par- 
tes imaginarias. Es la imagen especular a través del eje real; cualquier número real es su 
propio conjugado, ya que b = O. El conjugado se denota por una barra o una estrella: 
(a +ibY* =a Fib =a — ib. Posee tres propiedades importantes: 


1. El conjugado de un producto es igual al producto de los conjugados: 
(a + ibXKc + id) = (ac — bd) —i(be + ad) = la +1ib) (c + id). (1) 
2. El conjugado de una suma es igual a la suma de los conjugados: 
(a +c) +1(b+d) = (a +0) — i(b +d) = (a +ib) +(c +id). 
3. Al multiplicar a + ib por su conjugado a — ib se obtiene un número real a? + b”: 
Valor absoluto (a +ibla—ib) =a +b? =r*. (2) 


Esta distancia r es el valor absoluto |a + ib| = Jal + Bb. 
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Ejemplo 1 


Ejemplo 2 


Por último, la trigonometría relaciona los catetos a y b con la hipotenusa r mediante a = 
r cos O y b = rsen 6. Al combinar estas dos ecuaciones se llega a las coordenadas polares: 


Forma polar a +ib =r(cosó +i¿seng) = re'?, (3) 


El caso especial más importante es cuando r = 1. Así, a + ibes el? = cos 6 + ¡sen0, y se 
encuentra sobre la circunferencia unitaria en el plano complejo. A medida que O varía de 
O a 27r, este número e* circula alrededor de cero a la distancia radial constante |e*?] = 


vV cos? 0 +sen?g = 1. 


x = 3 + 4¿ multiplicado por su conjugado X = 3 — 4 ¡es igual al valor absoluto al cuadrado: 
xx = (3 +43 — 41) =25 = Jr]? de modo que r = |x|] = 5. 


Para dividir entre 3 + 4í, el numerador y el denominador se multiplican por su conjugado 
O 
Pe II A a O LU 


O o A A O AA APS 


3+4i  3+4i 3-—4i 2. 
En coordenadas polares, la multiplicación y la división son fáciles: 


re? multiplicado por Re'” tiene valor absoluto rR y ángulo 9 + «a. 
re? dividido entre Re'” tiene valor absoluto r/R y ángulo 9 — «e. 


Longitudes y traspuestas en el caso complejo 


Volvemos al álgebra lineal, y se efectúa la conversión de reales a complejos. Por defini- 
ción, el espacio vectorial complejo C” contiene a todos los vectores x con n componentes 
complejas: 
X1 
X2 
Vector complejo x= |. | concomponentes x; =4; + ib. 


Xn 


La suma de los vectores x y y sigue haciéndose componente por componente. La multiplica- 
ción escalar cx ahora se realiza con números complejos c. Los vectores vy, .. ., v, son lineal- 
mente dependientes si alguna combinación no trivial proporciona c,V, ++ ** +CgUk = 0; 
ahora los c, deben ser complejos. Los vectores de coordenadas unitarios siguen estando en 
C”; siguen siendo independientes, y siguen siendo una base. En consecuencia, C” es un es- 
pacio vectorial complejo de dimensión n. 


En la nueva definición de longitud, cada x? se sustituye por su módulo hoj: 





Longitud al cuadrado = bare pal (0 


et 


fa A 
= H y o IP=2 y= b ke + y lvl? =25, 
Para vectores reales, entre la longitud y el producto intemo había una relación estrecha: 
lx? = x*x. Se desea preservar esta relación. El producto interno debe modificarse para 
coincidir con la nueva definición de longitud, de modo que en el producto interno se con- 
juga el primer vector. Al sustituir x por x, el producto interno se convierte en 


Producto interno 7 É ' ==, yr + : 3 E S (5) 
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Si se toma el producto interno de x = (1 + í, 32) consigo mismo, se regresa a [lx ||?: 
Longitud al cuadrado 3*x =(1+D0+0+GDGD=2+9 y  lxl? = 11. 


Observe que y*x es diferente de x*y; es necesario vigilar el orden de los vectores. 


Lo anterior deja un solo cambio más en la notación, resumiendo dos símbolos en 
uno. En vez de una barra para el conjugado y una T para la traspuesta, estos símbolos se 
combinan en la traspuesía conjugada. Para vectores Ss Y matrices, un supraíndice H (o una 
estrella) combina ambas operaciones. Esta matriz 4” = AR = A* se denomina “A her- 
mitiana”: 


“¿A hermitiana” AF ="A” tiene elementos (49), j¡= Aj (6) 
El lector debe estar muy atento para distinguir esta denominación de la expresión “A es her- 


mitiana”, lo cual significa que A es igual a AF. Si A es una matriz de m por n, entonces AS 
es de n por mm: 


s e 
Traspuesta o A O A 
conjugada Ne ; A 5: 30 


Este símbolo A* otorga reconocimiento oficial al hecho de que, con elementos complejos, 
es muy raro que sólo se busque la traspuesta de A. Es la traspuesta conjugada A* lo que se 
vuelve idóneo, y 1% es el vector renglón [Xi ... Xnl. 









-5N 1. El producto interno, de 2 yy. es 7 Los vectores s ortogonales cumplen 
o z Te Ióngitua al cuadrado! ide bo es lb pat x= air: 
3 Al oe Aa = BA se se e Obtiene dl aa se Año 





Matrices hermitianas 


En capítulos previos se habló de matrices simétricas: A = A*. Con elementos complejos, 
es necesario ampliar el concepto de simetría, La generalización correcta no es hacia matri- 
ces que son iguales a su traspuesta, sino a matrices que son iguales a su traspuesta con- 
jugada. Estas son las matrices hermitianas, de las cuales un ejemplo típico es: 


A e E ES e O 
Matriz hermitiana A = | 3 +3 5 | = A”, Y) 
Los elementos diagonales deben ser reales; la conjugación los deja sin cambio. Cada ele- 
mento fuera de la diagonal es compensado por su imagen especular a través de la diagonal 
principal, y 3 — 3íes el conjugado de 3 + 3. En cada caso, 4;; = Aji. 

Nuestro objetivo principal es establecer tres propiedades básicas de las matrices her- 
mitianas. Estas propiedades son igualmente válidas para las matrices simétricas. Una ma- 
triz simétrica real ciertamente es hermitiana. (Para matrices reales no hay diferencia entre 
AT y ld Los valores característicos de A son reales, como se demostrará a continuación. 











- Propiedad 1 Si A = A AE ont para todos los vectores complejos x, el número 
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Cada elemento de A contribuye a x%Ax. Intente el caso de 2 por 2 con x = (u, v): 


_a[ 2 3-3] lu 
A 3 5 15 


= 2Zuu + 30v + (3 — 310)uv + (3 + 30uv 
= real + real + (suma de conjugados complejos). 


Para una demostración en general, (xH AxyH es el conjugado de la matriz de 1 por 1 
“Ax, aunque en realidad se obtiene otra vez el mismo número: (xHAx)H = xH ¿HxHH = 
xH “A x. Por a este número debe ser real. 


EAS a LITA a e ee ni al AI Io E 
E Y E A Y ; A 


- Propiedad 2 Si, 4= 4% todo valoro característico es real. ZE 
Demostración Suponge que Ax = Ax. El truco consiste en multiplicar por 
xH:xHAx = 2xHx. Por la propiedad 1, el miembro izquierdo es real, y el miembro dere- 
cho xHx = lIx]1? es real y positivo, ya que x Y% O. En consecuencia, 1 = xHAx/x*Hx 
debe ser real. En el ejemplo se tiene 1 =8 yA = —l: 








me O e e a E o 
¡AA = (2,3; E pen 7A +10 —[3 — 3] 
=4* 748 =(2 —8NA +1). (8) 
a 
Nota Esta demostración de valores característicos reales es correcta para cualquier ma- 
trIz real: 
Demostración ] Z ae E 
Falca Ax Xx proporciona x* Ax = Ax"x, de modo que A T es real 


Debe haber una trampa: El vector característico x podría ser complejo. Es cuando A = A* 
que se tiene la certeza de que A y x son reales. Más que eso, los vectores característicos 
son perpendiculares: x*y = O en el caso simétrico real y x%y = 0 en el caso hermitiano 
e 





La demostración empieza con 4x = A¡x, Ay =A2y, y A = AF; 
Ao) "y =(A0) y =x "Ay =x*(22y). (9) 


Los números exteriores son Ax Ay = 2x4 y, ya que los As son reales. Ahora se utiliza la 
hipótesis de que A, 7 A, que obliga a concluir que x*y = 0. En el ejemplo, 


=6 3-3] [x=] _ [o e 
3+3  -—3 X2 0” CC 1l+¿ 


e 3 ON a AA E [la 
cb E 


Estos dos vectores característicos son ortogonales: 


xy =[1 1-i] Jae =0, 


(A —8Dx 


ll 


5 
| 
z | 
| 
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Ejemplo 3 
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Por supuesto, cualesquiera múltiplos x/a: y y/f son igualmente válidos que los vecto- 
res característicos. MATLAB escoge a: = [lx] y f = |py]], de modo que x/« y y/£ son vec- 
tores unitarios, los vectores característicos son normalizados para que su longitud sea 1. 
Ahora son ortonormales. Si estos vectores característicos se escogen como las columnas 
de $, entonces se tiene S714S = A, como siempre. La matriz de diagonalización puede 
escogerse con columnas ortonormales cuando A = AF, 

En caso de que A sea real y simétrica, por la propiedad 2 sus valores característicos 
son reales. Por la propiedad 3, sus vectores característicos unitarios son ortogonales y tam- 
bién son reales; resuelven (4 — ADx = 0. Estos vectores característicos ortonormales van 
en una matriz ortogonal O, 
con 09 = 1 y Q* = Q7? Así, STLAS = A se vuelve especial: es Q7'AQ =A o 
A =0A0Q” = QAO”, Ahora es posible enunciar uno de los grandes teoremas del álge- 
bra liacal 

50 “Un: matriz o métricas el puedo f ETS en ye - QA or: Sn vectores Sd 
racterísticos ortonormales están e en e, matriz, ortogonal 2,3 ed sus: s valores característi- é 
cos.están en A. OS be | ] PA SS E ESC 





En geometría o mecánica, este es el teorema de los ejes principales. Proporciona la 
elección correcta de ejes para una elipse. Estos ejes son perpendiculares, y apuntan a lo lar- 
go de los vectores característicos de la matriz correspondiente. (En la sección 6.2 se rela- 
cionan las matrices simétricas con elipses n-dimensionales). En mecánica, los vectores 
característicos proporcionan las direcciones principales, a lo largo de las cuales hay cora- 
presión pura o tensión pura, sin esfuerzo de corte. 

En matemáticas, la fórmula A = QAO” se conoce como teorema espectral. Si se multi- 
plican las columnas por los renglones, la matriz A se convierte en una combinación de proyec- 
ciones unidimensionales, que son las matrices especiales xx* de rango 1, multiplicadas por A: 


Az A AS 
A=0A0” = E 1 | 
| | MES 








n 


e dx + haX2x2 ic o e (0) 


En el ejemplo los valores característicos son 3 y 1: 


1 
a qa 
ai] 


Los vectores característicos, con longitud escalada a 1, son 


==) 8 
—— AS Xa == i.]l. 
e al de A 


Así, las matrices del miembro derecho son xx? y x2x2 —colummnas por renglones— y 


son proyecciones sobre la recta que pasa por x, y la recta que pasa por x2. 
Todas las matrices simétricas son combinaciones de proyecciones unidimensionales, 
que son matrices simétricas de rango 1. 


mE = combinación de dos proyecciones 


Nip nj 
Ni Ni. 


Di Niro 


Observación Si A es real, y ocurre que sus valores característicos son reales, entonces tam- 
bién sus vectores característicos son reales. Resuelven (A — Ax = 0 y pueden calcularse 
por eliminación. Sin embargo, no son ortogonales, a menos que Á sea simétrica: 
A =QAQ” llevaaA*? =A. 
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> lo ps 1 a bad 
Pe 
ES e AS, 


Si A es real, todos los valores característicos complejos se convierten en pares conju- E 
gados: Ax = Ax y AX =1AxX. Sia + ib es un valor característico de una matriz real, tam- E 
bién lo es a — ib. (Si A = A*, entonces b = 0.) E 


Hablando estrictamente, el teorema espectral A=Q0AO' sólo se ha demostrado : E 
cuando los valores característicos de A son distintos. Entonces ciertamente hay n vectores k A 
característicos independientes y A puede diagonalizarse con seguridad. No obstante, es E 
cierto (consulte la sección 5.6) que incluso con valores característicos repetidos, una ma- E 
triz simétrica sigue teniendo un conjunto completo de vectores característicos ortonorma- 
les. El caso extremo es la matriz identidad, que tiene A = 1 repetido n veces, y no carece 
de vectores característicos. 

Para terminar el caso complejo se requiere el análogo de una matriz ortogonal real, y 
el lector puede conjeturar lo que ocurre al requerimiento OO = I. La traspuesta se susti- 
tuye por la traspuesta conjugada. La condición se vuelve UU = I. La nueva letra U refle- 
ja la nueva denominación: Una matriz compleja con columnas ortonormales se 
denomina matriz unitaria. 


VMatrices unitarias 


¿Se nos permite proponer dos analogías? Una matriz hermitiana (o simétrica) puede com- 
pararse con un número real. Una matriz unitaria (u ortogonal) puede compararse con 
un número en la circunferencia unitaria: un número complejo de valor absoluto 1. Los 
As son reales si A% = A, y están en la circunferencia unitaria si UU = /. Los vectores ca- 
racterísticos pueden escalarse a longitud unitaria y hacerse ortonormales.* 

Hay dos afirmaciones aún no demostradas para matrices unitarias (incluyendo las or- 
togonales). En consecuencia, pasamos de inmediato a las tres propiedades de U que corres- 
ponden a las propiedades anteriores 1 a 3 de A. Recuerde que las columnas de U son 
ortonormales: 


Matriz unitaria  —U*Y=J[, UU. NU => 0. 


Lo anterior lleva directamente a la propiedad 1”, que la multiplicación por U no afecta los 
productos internos, los ángulos, o las longitudes. La demostración se hace en una línea, jus- 
to como lo fue a OQ: 


KE . ito > 50 ES E Aa NS: erre 


. Propiedad y (UD me - ayi) E My: y, qe preserva va las Inside: o o | 
E 10% ÍP > = O RUZ 4 | E 





: La longitud permanece sin cambio 


15 





Propiedad 2' Todo valor característico de U tiene valor absoluto [A = 1.0200 


Lo anterior se concluye directamente de Ux = Ax, al comparar las longitudes de los 
dos miembros: |U xj] = |]x]] por la propiedad 1”, y siempre JlAx | = |A|llx]|. En conse- 
cuencia, [A] = 






Propiedad 3 Los vectores característicos correspondientes a valores peto: 
distintos son ortonormales, O 





“Más tarde se compararán las matrices “antihermitianas” con los números imaginarios puros, y las matrices “nor- 
males” con todos los números complejos a + ¿b. Una matriz no normal sín vectores característicos ortogonales 
no pertenece a ninguna de estas clases, y está fuera de toda analogía. 





Ejemplo 4 


Ejemplo 5 


Ejemplo 6 
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Se empieza con Ux = Ax y Uy = Ay, y se toman productos internos por la propiedad 1': 
y = (UN (U y) = M1 0 Ary) = Mary. 
Al comparar la izquierda con la derecha, 4142 = 1 o x%y = O. Pero la propiedad 2' es 


A1A1 = 1, por lo que no puede tenerse 4142 = 1, Así, %y = 0 y los vectores característicos 
son ortogonales. 


cosí sen! 
v=| 


tiene valores característicos el! y e Y, 
sent cost 


Los vectores característicos ortogonales son x = (1, —1) y y = (1, 2). (Recuerde tomar con- 
jugados en y = 1 + ¿* = 0). Después de la división entre ./2 son ortonormales. 


A continuación se presenta la matriz unitaria, con mucho, la más importante que hay, 


1 1 . 1 
E 1 1 w + w"Ti | Matriz de Fourier 
Jn , , A : Jn 
1 grito. yn? 


El número complejo w está en la circunferencia unitaria al ángulo 9 = 277n. Es igual a 
e%rila Sus potencias son equidistantes alrededor de la circunferencia. Esa separación asegu- 
ra que la suma de todas las n potencias de w —-todas las raíces n-ésimas de l— es cero, Al- 
gebraicamente, la suma 1 +w ++ +*+w" Nes (w” — D/(w — 1). ¡Y (w” — 1) es cero! 








el renglón 1 de UA multiplicado 1 > eS wei 
as af A e == = 0. 
por la columna 2 de U es ió 5 ai A! sl 
el renglón ide UH multiplicado 1 A O ¿il 
(1 + “o. <q 72 = =(. 
por la columna ¡de U es e did Li | i 


En el segundo caso, W = w”*, Cada elemento de la F original tiene valor absoluto igual 
a 1. El factor ./n encoge las columnas de U en vectores unitarios. La identidad funda- 
mental de la transformada finita de Fourier es UYU = LI. 

Así, U es una matriz unitaria. Su inversa se ve igual, excepto que w se sustituye por 
wal = ¿79 = 7, Debido a que U es unitaria, su inversa se encuentra trasponiendo (con 
Jo cual todo permanece igual) y conjugando (con lo cual w cambia a W). La inversa de es- 
ta U es Y. Ux puede calcularse rápidamente mediante la transformada rápida de Fourier 
según se encontró en la sección 3.5. 

Por la propiedad 1* de las matrices unitarias, la longitud de un vector x es la misma 
que la longitud de Ux. La energía en el espacio estado es igual a la energía en el espacio 
transformado. La energía es la suma de |x;|?, y también es la suma de las energías en las 
frecuencias por separado. El vector x = (1,0,..., 0) contiene cantidades iguales de cada 
componente de la frecuencia, y su transformada de Fourier discreta Ux = (1, 1,..., 1Y 
/n. también tiene longitud 1. 


mi 


E 
OOO sé 
O O + O 
O - OÓ 


Esta es una matriz ortogonal, de modo que por la propiedad 3” debe tener vectores Carac- 
terísticos ortogonales. ¡Estos son las columnas de la matriz de Fourier! El valor absoluto 
de sus valores característicos debe ser 1. 
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Hay números 1,w,...,w"”!(o 1,1,1*, ¿? en este caso de 4 por 4). Es una matriz real, aun- 


que sus valores característicos y vectores característicos son complejos. 


<A 
=S 
« 4 
Z 
53 
r ya 
$e 
EA 
< 
> 
3 
ES 
£ 
ES 


Una nota final: Las matrices antihermitianas cumplen KPY = —K, así como las matri- 
ces simétricas sesgadas satisfacen KT = —K. Sus propiedades se concluyen de inmediato, 
a partir de su estrecho vínculo con las matrices hermitianas: 








SON EEC RICOS e) 


Los valores característicos de K son puramente imaginarios, en vez de puramente reales; 
se multiplica por í. Los vectores característicos no cambian. El ejemplo hermitiano de las 
páginas previas conduciría a 


H 
3431 Si A 
Los elementos diagonales son múltiplos de ¿ (permitiendo el cero). Los valores caracterís- 
ticos son 8i y —i. Los vectores característicos siguen siendo ortogonales, y sigue teniéndo- 
se K = U AUF —con una U unitaria en vez de una O ortogonal real, y con 8i y —i en la 
diagonal de A. 

Esta sección se resume con una tabla de paralelismos entre reales y complejos. 


K=i4=| 21 pá 


Real contra complejo 


R” (n componentes reales) > C” (n componentes complejas) 
longitud: [|x[1? = x? +++ +x2 + longitud: [|xI? = [x1]* +--- + kx]? 
traspuesta: A] = Aj > traspuesta hermitiana: AÑ = Aj: 
(ABY = BA? > (AB) = BRA? 
producto interno: x7y = xy, +: ** + xp) > Ry = 1 + c+ Xd 


(A) y =x (A y) 
ortogonalidad: xy =0 


(Ax? y = x (4% y) 

ortogonalidad: xHy = 0 

matrices hermitianas: A% = A 
A=UAUT! = AUF (A real) 
antihermitiana K* = —K 

UEU = [ unitaria o bien UH = y”! 
(UXHUy) =xPy y [UxI| = l[xl 


matrices simétricas: AY = A 

A =QAOQO” = QACQ” (A real) 
simétrica sesgada K* = —K 

ortogonal Q*Q = 1 obien, Q* = Q7! 
(0010 =y y 11Qxll = llxl 


PITrdd? 


Las columnas, los renglones, y los vectores característicos de Q y U son ortonormales, y todo [Aj = 1. 


dl Conjunto de problemas 5.5 


1. Para los números complejos 3 + 4¡y 1 — il: 
a) Encuentre sus posiciones en el plano complejo. 
b) Encuentre su suma y su producto. 
Cc) Encuentre sus conjugados y sus valores absolutos. 


¿Los números originales están dentro o fuera de la circunferencia unitaria? 


10. 


EL. 
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¿Qué puede decir sobre 


a) la suma de un número complejo y su conjugado? 

b) el conjugado de un número que está sobre la circunferencia unitaria? 
c) el producto de dos números que están sobre la circunferencia unitaria? 
d) la suma de dos números que están sobre la circunferencia unitaria? 


Six=2+iyy=l + 31, encuentre X, xx, xy, lx y x/y. Compruebe que el valor 
absoluto |xy]| es igual a lx] multiplicado por [y], y que el valor absoluto |1/x] es igual a 1 
dividido entre |x]. 


Encuentre a y b para los números complejos a + ib a los ángulos 9 = 30%, 60%, 909 
sobre la circunferencia unitaria. Compruebe por multiplicación directa que el cuadra- 
do del primero es el segundo, y que el cubo del primero es el tercero. 


a) Six = re”, ¿cuáles son 12, x7*, y YX en coordenadas polares? ¿Dónde están los nú- 
meros complejos que tienen x7! =X? 


b) En £ = 0, el número complejo e(71*9* es igual a la unidad. Trace su trayectoria en 
el plano complejo cuando t crece desde O hasta 271. 


Encuentre las longitudes y el producto interno de 


_[2-di _[2+4i 
S 4i y y di |" 


Escriba la matriz A*, y calcule C = APA si 


E iO 
cl EA 


¿Cuál es la relación entre C y C%? ¿Esto se cumple siempre que C se construye a par- 
tir de alguna AA? 


a) Con la A precedente, use eliminación para resolver Ax = 0. 

b) Demuestre que el espacio nulo que calculó es ortogonal a C(4%) y no al espacio 
renglón de costumbre C(A*). Los cuatro espacios fundamentales en el caso com- 
plejo son N(A) y C(4) como antes, y luego N(4%) y C(a45). 


a) ¿Cómo está relacionado el determinante de AP con el determinante de A? 
b) Demuestre que el determinante de cualquier matriz hermitiana es real, 


a) ¿Cuántos grados de libertad hay en una matriz simétrica real, en una matriz diago- 
nal real, y en una matriz ortogonal real? (La primera respuesta es la suma de las 
otras dos, ya que A = QAO”,) 

b) Demuestre que las matrices hermitianas A de 3 por 3 y también la U unitaria tienen 
9 grados de libertad (las columnas de U pueden multiplicarse por cualquier es; 


Escriba P, O y Ren la forma 2yx1xP + A2x2x1 del teorema espectral: 


Í 1 
212 2 ON is 
“lar elo) Ll - 
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12. Proporcione una razón si es verdadero o un contraejemplo si es falso: 


a) Si A es hermitiana, entonces A + il es invertible. 
b) Si O es ortogonal, entonces O + , Í es invertible. 
Cc) Si A es real, entonces A + il es invertible. 


13. Suponga que Á es una matriz simétrica de 3 por 3 con valores característicos 0, 1, 2. 


a) ¿Qué propiedades pueden garantizarse para los vectores característicos unitarios 
correspondientes u, uv, w? 

b) En términos de u, v, w, describa el espacio nulo, el espacio nulo izquierdo, el espa- 
cio renglón, y el espacio columna de A. 

c) Encuentre un vector x que cumpla Áx = yv + w, ¿xes único? 

d) ¿En qué condiciones sobre b, Ax = b tiene una solución? 

e) Si u, v, w son las columnas de S, ¿cuáles son S”* y S7145? 


14. En la siguiente lista, ¿qué clases de matrices contienen a A, y cuáles contienen a B? 
0-4 00 E OA CO 


O O 
A] - 


0 1 
1 1 
0 1 


== O O 
0 O 
plo a pd 


¡ES 
E 1 
O: 
Ortogonales, invertibles, proyección, permutación, hermitianas, de rango 1, diagona- 
lizables, de Markov. Encuentre los valores característicos de A y B. 


15. ¿Cuál es la dimensión del espacio S de todas las matrices simétricas reales de n por n? 
El teorema espectral establece que toda matriz simétrica es una combinación de n ma- 
trices proyección. Debido a que la dimensión excede a n, ¿cómo se explica esta dife- 
rencia? 


16. Escriba un hecho importante sobre los valores característicos de cada uno de los si- 


guientes incisos. 


a) Una matriz simétrica real. 

b) Una matriz estable: todas las soluciones de du/dt = Au tienden a cero. 
c) Una matriz ortogonal. 

d) Una matriz de Markov. 

e) Una matriz defectuosa (no diagonalizable). 

f) Una matriz singular. 





17. Demuestre que si U y V son unitarias, también lo es U V. Use el criterio UFU = 1. 


18. Demuestre que una matriz unitaria tiene [det U] = 1, aunque quizá det U es diferente 
de det UF. Describa todas las matrices de 2 por 2 que son unitarias. 


19. Encuentre una tercera columna, de modo que U sea unitaria. ¿Cuánta libertad hay en 
la columna 3? 


1173 31 
U=|1/43 0 
YB 1/42 


20. Diagonalice la matriz antihermitiana de 2 por2 K = E e cuyos elementos son to- 
dos. y eL 





21. 


22. 


23. 


24. 


25, 


26. 


ate 


28. 


29. 


30. 


3L. 
Ls 
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Calcule e%* = Se*"S7* y compruebe que e** es unitaria. ¿Cuál es la derivada de e** 
en 1 = 07 


Describa todas las matrices de 3 por 3 que simultáneamente son hermitianas, unitarias, 
y diagonales. ¿Cuántas hay? 


Toda matriz Z puede separarse en una parte hermitiana y una parte antihermitiana, 
Z =A + K, así como un número complejo z puede separarse en a + ¿b. La parte real 
de z es la mitad de 2 +7, y la “parte real” de Z es la mitad de Z + Z*, Encuentre una 
fórmula semejante para la “parte imaginaria” K, y separe estas matrices en A + K: 


_[3+i 4+2 0 E 
2= (>; 5 | y 2= |, 5 
Demuestre que las columnas de la matriz de Fourier de 4 por 4 en el ejemplo 3 son 
vectores característicos de la matriz permutación P en el ejemplo 6. 


Para la permutación en el ejemplo 6, escriba la matriz circulante € = cgl + c,P + 
caP? + c¿P?. (Su matriz vector característico es nuevamente una matriz de Fourier.) 
También escriba las cuatro componentes del producto matriz-vector Cx, que es la con- 
volución de € = (Cp, C1, C2, 03) Y x= (Xo0, X1, X2, X3). 


Para una matriz circulante € = FAF7!, ¿por qué es más rápido multiplicar por F7?, 
luego por Á, y luego por F (regla de convolución), que multiplicar directamente por 
De 


Encuentre las longitudes de u = (1 + 1,1 — ¿, 1 + 21) y uv = (i, í, £). También encuen- 
tre uPy y viy, 


Demuestre que AFA siempre es una matriz hermitiana. Calcule AYA y AA: 


E o 
a 


Si Az = O, entonces AX Az = 0, Si AXAZ = O, multiplique por z* para demostrar que 
Az = 0. Los espacios nulos de A y AY A son . AFA es una matriz hermitiana in- 
vertible cuando el espacio nulo de A sólo contiene a z = 


Cuando una matriz hermitiana se multiplica por un número real c, ¿cA sigue siendo 
hermitiana? Si c = £, demuestre que ¡ A es antihermitiana. Las matrices hermitianas 
de 3 por 3 constituyen un subespacio, en el supuesto de que los “escalares” sean nú- 
meros reales. 


¿Qué clases de matrices P pertenecen a: ortogonales, invertibles, hermitianas, unita- 
rias, factorizables en LU, factorizables en OR? 


0. 300 
RSU 0? A 
IO 


Calcule P?, P?, y PY en el problema 30. ¿Cuáles son los valores característicos de P? 


Encuentre los vectores característicos unitarios de P en el problema 30, y luego escrí- 
balos en las columnas de una matriz unitaria U. ¿Qué propiedad de P hace ortogona- 
les a estos vectores característicos? 


292 


Capítulo 5 Valores característicos y vectores característicos 


3: 


34, 


E 


36. 


E q 


38. 


39, 


40. 
41. 
42. 
43. 


44. 


45. 


46. 


47. 


48. 
49. 


Escriba la matriz circulante de 3 por 3 C = 21 + 5P + 4P?. Tiene los mismos vecto- 
res característicos que P en el problema 30. Encuentre sus valores característicos. 


Si U es unitaria y O es una matriz ortogonal real, demuestre que U”? es unitaria, y 
también que UQO es unitaria. Empiece con UYU = ] y Q*O = 1. 


Diagonalice A (As reales) y K (As imaginarios) para llegar a UAU*: 


Me E A E E E 
alza E E i | 


Diagonalice la siguiente matriz ortogonal para llegar a Q = UAUY, Ahora todos los 


ÁS son 
gs cosÚé —senó 
sené  cosé 


Diagonalice la siguiente matriz unitaria, V para llegar a Y = Y AU*. Nuevamente, to- 
dos los jA| = 1: 


1 ns 
As 1 dE : 
A ll 
Siv;,..., v, es una base ortonormal de C”, la matriz con estas columnas es una ma- 


triz . Demuestre que cualquier vector z es igual a (vHzJw, + +++ + (vHow,. 


Las funciones e” y e” son ortogonales en el intervalo O < x < 271 porque su produc- 
to interno complejo es fi" _____=0. 


Los vectores v = (1,1, 1),w=(1,1,0)yz= son una base ortogonal de 





Si A =R + ¿S es una matriz hermitiana, ¿las matrices R y S, son simétricas? 


La dimensión (compleja) de C” es . Encuentre una base no real de C”. 





Describa todas las matrices de 1 por 1 que sean hermitianas y también unitarias. Ha- 
ga lo mismo para las matrices de 2 por 2. 

¿Cómo están relacionados los valores característicos de AY (una matriz cuadrada) con 
los valores característicos de A? 

Si uy = 1, demuestre que 7 — 244% es hermitiana y también unitaria. La matriz uu? 
de rango l es la proyección sobre ¿qué recta en C”? 


: OS A —B 
SiA + ¡B es una matriz unitaria (A y B son reales), demuestre que Q = E ri es 
una matriz ortogonal. 


: ; eS A —R : 
Si A + 1B es una matriz hermitiana (4 y B son reales), demuestre que | B A es si- 
métrica. 

Demuestre que la inversa de una matriz hermitiana también es hermitiana. 


Diagonalice la siguiente matriz, construyendo su matriz valor característico Á y su 
matriz vector característico S: 


alí jan 


Una matriz con vectores característicos ortonormales es de la forma A = UAU”T = 


UAUF. Demuestre que AAR = AFA. Éstas son exactamente las matrices normales. 


CIRO 





A iy 
AS 


SS 
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5.6 TRANSFORMACIONES DE SEMEJANZA 


Virtualmente, cada paso de este capítulo implicó la combinación S”*AS. Los vectores carac- 
terísticos de A se fueron en las columnas S, con lo cual S'AS se volvió una matriz diagonal 
(denominada A). Una vez que A era simétrica, en vez de S, se escribió OQ, escogiendo que los 
vectores característicos fuesen ortonormales. En el caso complejo, cuando A es hermitiana, 
se escribió U, que sigue siendo la matriz de vectores característicos. Ahora se consideran to- 
das las combinaciones M”*AM, formadas con cualquier M invertible en la derecha y su in- 
versa en la izquierda. La matriz vector característico invertible $ podría no existir (el caso 
defectuoso), o podría no ser conocida, e incluso podríamos no querer utilizarla, 

Primero un nuevo comentario: Las matrices Ay M”* AM son “semejantes”. Pasar de 
una a otra es una transformación de semejanza. Es el paso natural para las ecuaciones di- 
ferenciales o matrices de potencias o valores característicos; así como los pasos de la eli- 
minación eran naturales para Ax = b. La eliminación multiplicaba A por la izquierda por 
L”*, pero no lo hacía por la derecha por L. De modo que U no es semejante a A, y los pi- 
votes no son los valores característicos. 

Toda una familia de matrices M” AM es semejante a A, y hay dos preguntas: 


1. ¿Qué tienen en común estas matrices semejantes M” 14M? 
2. Con una elección especial de M, ¿qué forma especial puede obtenerse mediante 
MT AM? 


La respuesta final la proporciona la forma de Jordan, con la que termina el capítulo. 
Estas combinaciones M” 14M se presentan en una ecuación diferencial o en diferen- 
cias, cuando un “cambio de variables” u = Mv introduce la nueva incógnita v: 


d . d A d 
ES Au se convierte en Ms = AMuv, obien, co M" AMv 
dt dt dt 


Un+| = Au, se convierte en Mu,+; = AMv,, O bien, Ua+1 = M7! AMows. 


La nueva matriz en la ecuación es M”*AM. En el caso especial M = S, el sistema no está 
acoplado porque A = S7!AS es diagonal. Los vectores característicos evolucionan de 
manera independiente. Esta es la simplificación máxima, aunque también son de utilidad 
otras Ms. Se intentará que trabajar con M” 14M sea más fácil que hacerlo con A. 

La familia de matrices M”*AM incluye a A misma, eligiendo M = 7. Cualquiera de 
estas matrices semejantes puede aparecer en las ecuaciones diferencial y en diferencias, 
mediante el cambio u = Mv, por lo que deben tener algo en común, como es el caso: las 
matrices de bd los mismos valores característicos. 





Empiece con Ax = Ax y sustituya A = MB M"): 
Mismo valor característico MBM"!Ix = Ax que es BM"*x=uMToO. (0 
El valor característico de B sigue siendo A. El vector característico ha cambiado de x a 
Mix. 
También puede comprobarse que A — Al y B — Al tienen el mismo determinante: 
Producto de matrices B-11 =MTAM-Al =MTA-ADM 
Regla del producto det(B — AI) = detM”"|det(A — AD det M = det(A — AL). 
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Ejemplo 1 


Los polinomios det(A —A1) y det(B — 41) son iguales. Sus raíces —los valores caracte- 
rísticos de A y B——son los mismos. A continuación se presentan las matrices B que son se- 
mejantes a A. 


A E 3) tiene valores característicos 1 y O. Cada B es M”!AM: 


SiM = E y |» entonces B= o O | triangular con A =1y0, 
| 1 1 
SiM = a E entonces B = h l proyección con A = 1 y0. 
2 a 


ll 


Si M b . , entonces B = una matriz arbitrariaconA = 1 y 0. 

En este caso es posible producir cualquier B con los valores característicos correctos. Se 
trata de un caso fácil, ya que los valores característicos 1 y O son distintos. La matriz dia- 
gonal A en realidad era A, el elemento distinguido de esta familia de matrices semejantes. 
La forma de Jordan estará preocupada sobre valores característicos repetidos y una posible 
carencia de vectores característicos. Todo lo que se dice ahora es que cada M” AM tiene el 
mismo número de vectores característicos independientes que A (cada vector característi- 
co se multiplica por M7 3). 

El primer paso es considerar las transformaciones lineales que están detrás de las ma- 
trices. Rotaciones, reflexiones, y proyecciones actúan sobre el espacio n-dimensional. La 
transformación puede ocurrir sin álgebra lineal, aunque ésta resulta en multiplicación de 
matrices. 


Cambio de base = Transformación de semejanza 


La matriz semejante B = M”*AM está estrechamente relacionada con A, si se regresa al es- 
tudio de las transformaciones lineales. Recuerde la idea clave: Toda transformación lineal 
está representada por una matriz. ¡La matriz depende de la elección de la base! Si la ba- 
se se cambia por M, entonces la matriz A se cambia por una matriz semejante B. 

Las matrices semejantes representan la misma transformación T respecto a bases 
diferentes. El álgebra es casi directa: Suponga que se tiene una base v,, ..., V,. La j-ésima 
columna de A se obtiene al aplicar Ta v;: 


Tv, = combinación de los vectores de la base = a;;v¡ + *** +anj¡Un. (0) 


Para una nueva base V,,..., V,, la nueva matriz B se construye de la misma forma: TV, 
= combinación de los Vs = b,,V¡ +: +: +0Dr¡V,. Pero también cada V debe ser una com- 
binación de los vectores de la base anterior: los V¿ = Y 7 m,,v;. Esta matriz M en realidad 
representa la transformación identidad (!) cuando todo lo que ocurre es el cambio de base 
(Tes D. La matriz inversa M7? también representa la transformación identidad, cuando la 
base se cambia de los vs de regreso a los Vs. Así, la regla del producto proporciona el re- 
sultado es se busca: 





o Ulea o lv 
E a a 


A AS A ASA A IA 
a E . nd NS HZ 














ENANA O a rd PO SAME 
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7 AAN 
ing. Pl e a TO SL URUGUAY 
e A A SAN : k 

Considero que la mejor forma de explicar B = M' "AM es con un ejemplo. Suponga 
que 7 es la proyección sobre la recta L al ángulo 6. Esta transformación lineal es descrita 
completamente sin ayuda de una base. Sin embargo, para representar T con una matriz se 
requiere de una base. En la figura 3.5 se presentan dos posibilidades, la base estándar 


v, = (1, 0), y, = (0, 1) y una base V,, V, escogida especialmente para 7. 
1 
al 


proyecta, 
a cero 


%-[ 


proyecta a Y, 


0 
= —E = —í 
135% e 1 135%, 
x o Ns 
y 


royección 00 AS 
p A 0.5 EN 










0.5 —0.5 us 
ao ios: 3 0.5 de 


Figura 5.5 Cambio de base, con la finalidad de hacer diagonal a la matriz proyección. 


De hecho, TV, = V, (porque V, ya está en la recta L) y TV, = O (porque V, es per- 
pendicular a la recta). En esa base de vectores característicos, la matriz es diagonal: 


a L. Y 
Base de vectores característicos B=IÍTlva y = P o! 
La otra cuestión es el cambio de matriz base M. Para ello, V, se expresa como una combi- 
nación v, Cos O + vu», sen 0 y estos coeficientes se escriben en la columna 1. De manera se- 
mejante, V, (o I/V, la transformación es la identidad) es —v, sen 0 + vz cos $, con lo que 
se obtiene la columna 2: 


Cambio de base M=[Ulva. = b dd 
La matriz inversa M7! (que aquí es la traspuesta) va de v a V. Combinada con B y M, pro- 
porciona la matriz proyección en la base estándar de us: 


2 
Base estándar A =MBM”" = p | 
ES. $ 

Es posible resumir la cuestión importante. La manera de simplificar la matriz A —de 
hecho diagonalizarla— significa encontrar sus vectores característicos. Éstos van en las co- 
lumnas de M (o de S) y MT AM es diagonal. El algebrista afirma lo mismo en el lenguaje 
de las transformaciones lineales: escoger una base que conste de vectores característicos. 
La base estándar llevó a A, lo cual no era sencillo. La base correcta condujo a B, que era 
diagonal. 

Nuevamente se recalca que M”*AM no surge cuando se resuelve Ax = b. Ahí la ope- 
ración básica fue multiplicar A (¡sólo por el lado izquierdo!) por una matriz que resta un 
múltiplo de un renglón de otro. Esta transformación preserva el espacio nulo y el espacio 
renglón de A: normalmente cambia los valores característicos. 

En realidad, los valores característicos se calculan por medio de una sucesión de se- 
mejanzas. La matriz avanza poco a poco hacia una forma triangular, y los valores caracte- 
rísticos aparecen de manera gradual sobre la diagonal principal. (Esta sucesión se describe 


A A ic 
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en el capítulo 7). Eso es mucho mejor que tratar de calcular det (A — AS), cuyas raíces de- 
ben ser los valores característicos. Para una gran matriz, numéricamente es imposible con- 
centrar toda esta información en el polinomio y obtenerla de nuevo. 


Formas triangulares con una MÍ unitaria 


Nuestro primer movimiento más allá de la matriz vector característico M = $ es un poco 
ilógico: en vez de una M más general, se avanza en dirección opuesta y M se restringe de 
modo que sea unitaria. Con esta restricción, M” AM puede alcanzar una forma T triangu- 
lar. Las columnas de M = U son ortonormales (en el caso real podría escribirse M = Q). 
A menos que los vectores característicos de A sean ortogonales, una diagonal U”1AU es 
imposible. Sin embargo, el “lema de Schur” en 5R es muy útil, por lo menos para la teo- 
ría. (El resto de este capítulo está dedicado más a la teoría que a aplicaciones. La forma de 
Jordan es pa de esta Dia A 





de | ria l A PE bu 
Sp aracterísticos dep: aparecen £ a Jo lago de la disgonal de. esta matriz semejante T 


SES E ER PRES 





Demostración Toda matriz, por ea de 4 por 4, tiene por lo menos un valor caracte- 
rístico A,. En el peor de los casos, puede estar repetido cuatro veces. En consecuencia, A 
tiene por lo menos un vector característico unitario x,, que se coloca en la primera colum- 
na de U. En esta etapa, es imposible determinar las otras tres columnas, por lo que la ma- 
triz se completa de cualquier forma que la deje unitaria, y se la denomina U,. (El proceso 
de Gram-Schmidt garantiza que esto es posible). Ax, = A,x, en la columna 1 significa que 
el producto U/* AU, empieza de forma correcta: 


Ag *k dk ok A E 
AU, =U, > Ro | “onducea U¡" AU, = : O 
O xx * o * O * hu 3% 


Luego, se trabaja con la submatriz de 3 por 3 en la esquina inferior derecha. Tiene un 
vector característico unitario x,, que se vuelve la primera columna de una matriz unitaria Mo: 


1 O IM O AS Y Ad + *k 

S e 0 = = 0 Az * Xx 
Si 02=|09 Ma entonces Uz*(U;¡*AU|,)U, = doo 
0 00 O + o 


En el último paso, un vector característico de la matriz de 2 por 2 en la esquina inferior de- 
recha pasa a una My unitaria, que se coloca en la esquina de Uy: 


Ay + a o 
: Pm =ly7-1 0 A * > pe 
Triangular Uz*(U;*U(* AU,U>)U» 0 o A (E E 
6 00 50 
El producto U = U,U,U sigue siendo una matriz unitaria, y U1A4U = T. E 


Este lema es válido para todas las matrices, sin la hipótesis de que A es diagonaliza- 
ble. Puede usarse para demostrar que las potencias de Af tienden a cero cuando todos los 





Ejemplo 2 


Ejemplo 3 
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|A¿] < 1 y las exponenciales e** tienden a cero cuando todos los Re ).;< 0, incluso sin 
el conjunto completo de vectores característicos que se supuso en las secciones 5.3 y 5,4. 


1 0 


La única línea de vectores característicos pasa por (1, 1). Después de dividir entre /2, es- 
ta es la primera columna de U, y la UT*AU = T triangular tiene los valores característicos 
sobre su diagonal: 


A A A ES 


A= F a tiene el valor característico A = 1 (dos veces). 


Diagonalización de matrices simétricas y hermitianas 


Esta forma triangular mostrará que cualquier matriz simétrica o hermitiana —-sin importar 
que sus valores característicos sean distintos o no— tiene un conjunto completo de vecto- 
res característicos ortonormales. Se requiere una matriz unitaria tal que UT1AU sea diago- 
nal. El lema de Schur justamente acaba de encontrarla. Esta 7 triangular debe ser diagonal, 
ya que también es hermitiana cuando A = A*: 


T=T"  (UTAUF =U*tA UD" = UT AU. 


La matriz diagonal U7?AU representa un teorema clave en álgebra lineal. 


ANNAN 
ARAS 






MI NS AA INESIS YAA AAA A 9 Na 





ANDA IAS NÓ RI Gal NE AS RS A 
Observación 1 En el caso simétrico real, los valores característicos y los vectores carac- 
terísticos son reales en cada paso. Así se obtiene una U unitaria real, que es una matriz or- 
togonal. 


Observación 2 A es el límite de matrices simétricas con valores característicos distintos. A 
medida que se tiende al límite, los vectores característicos permanecen perpendiculares. 
Esto puede fallar si A % A*: 


O cos9 


A(0) = ti t terísticos ) cos 
(9) = De ena ene vectores característico 0 y O 


E 5 : : ; du El 1 
Cuando 6 —> 0, el único vector característico de la matriz no diagonalizable É | es [5] . 


El teorema espectral establece que esta 4 = A* puede diagonalizarse: 


DTO 
A=|1 0 0| con valores característicos repetidos A, =42 =1 y A3= —1. 


9D Al 
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= 1] tiene un plano de vectores característicos, y se escoge un par Xx, y X2! 


1 1 0 1 1 
x=—=|l y x>=J0t y x3=-=|-1| para 43 = —1. 
20 1 SA E 


Estas son las columnas de Q. Al separar A = QAO* en 3 columnas multiplicadas por 3 
renglones se obtiene 


1 
O 50 Z 0 05070 a O 
ASILO 01 a 0 A 05 0 04 HA => . 50d. 
0 0 1 0.0.0 0-0 1 05 5070 


Debido a que A, = Az, estas dos primeras proyecciones xxi y x2x2 (cada una de ran- 
go 1) se combinan para proporcionar una proyección P, de rango 2 (sobre el plano de vec- 
tores característicos). Así, A es 


0% O A E y 
O A q a 2 2 
1.0 0(=A4P+%B=(+D|P 3 0|+(-Di=3 3 0|. 65) 
arapeaa o 0 1 0 0.0 


Toda matriz hermitiana con k valores característicos distintos tiene una descomposición 
espectral en A = 21¡P, + *** + AP, donde P; es la proyección sobre el espacio carac- 
terístico para );. Debido a que hay un conjunto completo de vectores característicos, la su- 
ma de las proyecciones es igual a la identidad. Y como los espacios característicos son 
ortogonales, dos proyecciones producen cero: P,P, = 0, 


Se está muy cerca de responder una pregunta importante, por lo que se continúa: ¿Pa- 
ra qué matrices se cumple que 7 = A? ¡Todas las T's simétricas, simétricas sesgadas y 
ortogonales son diagonales! Las matrices hermitianas, antihermitianas y unitarias, también 
están en esta clase. Corresponden a números en el eje real, el eje imaginario, y en la cir- 
cunferencia unitaria. Ahora se busca toda la clase, que corresponde a todos los números 
complejos. Las matrices se denominan “normales”. 





sr ON matriz A es "normal sá coma con N% N ¡NA H=N NN. Para tales n matrices, 
y no. Otras, la triangular. TS SUE END, es la diagonal Ae Ao matrices. normales, son 








o ortonormales. * e 





Ciertamente, las matrices simétricas y las matrices hermitianas son normales: Si A = 
AF, entonces ambas AAF y AYA son iguales a A?. Las matrices ortogonales y las unitarias 


también son normales: ambas UUP y UF U son iguales a f. Para cualquier matriz normal 
bastan dos pasos: 


1. SiN es normal, también lo es la triangular 7 = UT" NU: 
TT*=U" NUUENYU =U" NNYU=U"NENU =UENFEUUTNU=TYT. 


2. ¡Una T triangular que sea normal debe ser diagonal! (Consulte los problemas 19 y 20 
al final de esta sección). 
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Entonces, si N' es normal, la triangular Y = U”*NU debe ser diagonal. Debido a que T tie- 
ne los mismos valores característicos que N, debe ser Á. Los vectores característicos de N 
son las columnas de Y, y son ortonormales. Éste es el buen caso. A continuación se regre- 
sa de las mejores matrices (normales) a las peores posibles (defectuosas). 


3%: 
Normal N = ES 4] Defectuosa A = be > 


La forma de Jordan 


Esta sección ha hecho su mejor esfuerzo a la vez que demandó que M sea una matriz uni- 
taria U. Se obtuvo M”*AM en una forma triangular T. Ahora se retira esta restricción so- 
bre M. Se permite cualquier matriz, y el objetivo es hacer M7” AM lo más diagonal posible. 

El resultado de este esfuerzo supremo para diagonalización es la forma de Jordan J. 
Si A tiene un conjunto completo de vectores característicos, se toma M = S y se llega a 
J = STIAS = A. Así, la forma de Jordan coincide con la diagonal A. Esto es imposible 
para una matriz defectuosa (no diagonalizable). Para todo vector característico faltante, la 
forma de Jordan tiene un 1 justo arriba de su diagonal principal. Los valores característi- 
cos aparecen sobre la diagonal porque J es triangular, Y siempre es posible desacoplar va- 
lores característicos distintos. 

Lo único que puede (o no) requerir un 1 fuera de la diagonal en J es un A repetido. 







o 5U ES 
o con Ss y bloques: a 


a 


Forma de Jordan  / =MAAM == 








Muchos autores han hecho de este teorema el punto clímax de su curso de álgebra li- 
neal. Francamente, considero que esto es un error. Ciertamente es verdad que no todas las 
matrices son diagonalizables, y la forma de Jordan es el caso más general. Simplemente 
por ello, su construcción es técnica y extremadamente inestable. (Un ligero cambio en A 
puede regresar todos los vectores característicos faltantes, y eliminar los 1s fuera de la dia- 
gonal.) En consecuencia, el lugar correcto para tratar los detalles es el apéndice, y la mejor 
manera de comenzar a trabajar con la forma de Jordan es considerando algunos ejemplos 
específicos y manipulables. 
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ET al 0 Ma 
Ejemplo 4 r=|) 3 y a= 3 y = (| ¡| conducen a Y = [o ql 


Estas cuatro matrices tienen valores característicos 1 y 1 con sólo un vector caracte- 
rístico, de modo que J consta de un bloque. A continuación se comprobará este hecho. “To- 
dos los determinantes son iguales a 1. Las trazas (las sumas abajo de la diagonal principal) 
son igual a 2. Los valores característicos satisfacen 1: 1=1y1w+1=2.Para T, B, y J, 
gue son triangulares, los valores característicos están sobre la diagonal. Se quiere demos- 
trar que estas matrices son semejantes: todas pertenecen a la misma familia. 


eu A ENEE 
A A A 


(DD) De Ta], la tarea es cambiar 2 a 1, y una matriz diagonal M lo hace: 


do O ZA O 1 1 
E. = = = 
IIS 
(B) De Ba], la tarea es trasponer la matriz. Esto se obtiene con una permutación: 
O 1 E OO e 
Fl == == pr 
ere =lo 1] => 
(A) De A a J, primero se va a T como en la ecuación (4). Luego se cambia 2 a 1: 


me 0 E OEA Eo PE e Ed A 
U au =|, 3 T  yentonces MTM O 1 Je 


e 0 OA 
Ejemplo5  A»=|0 O 1 E SO O E 
0.0.0 0.0.0 


Cero es un triple valor característico de A y B, por lo que aparece en todos sus bloques de 
Jordan. Puede haber un solo bloque de 3 por 3, o un bloque de 2 por 2 y un bloque de 1 
por 1, o tres bloques de 1 por 1. Así, A y B tienen tres posibles formas de Jordan: 


01.0 0 1 0 0.5000 
J=3/0 0 11, Jf=|j0 0 01], Jfj=|0 0 01 (8) 
0.0.0 0.0.0 0.00 


El único vector característico de A es (1, 0, 0). Su forma de Jordan sólo tiene un blo- 
que, y A debe ser semejante a J,. La matriz B tiene el vector característico adicional (0, 1, 
0), y su forma de Jordan es J¿ con dos bloques. Así como para J, = matriz cero, de suyo 
constituye una familia; la única matriz semejante a Jz es M"0M = O. Un conteo de los 
vectores característicos determina J cuando no hay nada más complicado que un valor ca- 
racterístico triple. 


Ejemplo 6 Aplicación a ecuaciones en diferencias y ecuaciones diferenciales (potencias y exponen- 
ciales). Si A puede diagonalizarse, las potencias de A = SAS” son fáciles: A* = SAtS7! 
. En cada caso se tiene la semejanza de Jordan A = M J] M ?, de modo que ahora se requie- 
ren las potencias de J: 


AF =(MIMTINAMIM)).- (MIMO) =MIM 7. 
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J es diagonal por bloques, y las potencias de cada uno de estos bloques pueden tomarse por 


separado: 
k 


o ARA RETA 
JIY=10 A 1l| =|0 44 Lol ; (9) 
O e AS 0 0 ES 


Este bloque /¿ entra en juego cuando A es un triple valor característico con un solo vector 
característico. Su exponencial está en la solución de la ecuación diferencial correspondiente: 


q te ¿ek 
Exponencial ezo et te (10) 
0 0 id 
Aquí I + Jit + (3,1121 + --- produce 1+ Af + 1212/21 + +++ =e*% en la dia- 
gonal. 
La tercera columna de esta exponencial proviene directamente de resolver du/di = J¡u: 
ra ica E 0 A 1] [uz| empezando con uy = [0]. 
uz 0007 Al lada 1 


Lo anterior puede resolverse por sustitución hacia atrás (ya que J; es triangular). La última 
ecuación duz/dt = uz produce uz = e”. La ecuación para uz es duz/di =4u42 + us, 
y su solución es te*. La ecuación de arriba es du,/di =24] + uz, y su solución es 
312e*, Cuando A tiene multiplicidad m con un solo vector característico, el factor adicio- 
nal + aparece m — 1 veces. 

Estas potencias y exponenciales de J forman parte de las soluciones u¿ y u(£). La otra 
parte es la M que relaciona la A original con la matriz más conveniente J: 


si Ux+, = Au, entonces us = Atun = MIJFM”" uo 
si du/di = Au entonces u(t) = e 4(0) = Me” M7 uo). 


Cuando M y J son S y A (el caso diagonalizable) aquéllas son las fórmulas de las seccio- 
nes 5.3 y 5.4, El apéndice B regresa al caso no diagonalizable, y muestra cómo es posible 
alcanzar la forma de Jordan. Espero que la tabla siguiente sea un resumen conveniente. 
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Conjunto de problemas 5.6 


1. 


10. 


11. 


12. 


Si B es semejante a Á y C es semejante a B, demuestre que C es semejante a A. (Sean 
B = M “AM y C = N"“BN.) ¿Qué matrices son semejantes a 1? 

Describa con palabras todas las matrices que son semejantes a E 0 , y encuentre 
dos de ellas. 

Explique por qué Á nunca es semejante a A + /. 


Encuentre una diagonal M integrada por 1s y —1s, para demostrar que 


2 | Y SL 
o: de IE. AL 2 
A = a es semejante a Bb = -1 > 1 
32 Ll 2 


Demuestre (si B es invertible) que BA es semejante a AB. 


a) Si CD = —DC (y D es invertible), demuestre que C es semejante a —C. 

b) Deduzca que los valores característicos de C deben presentarse por parejas más- 
menos. 

c) Demuestre directamente que sí Cx = Ax, entonces C(Dx) = —1(Dx). 


Considere cualquier A y una “rotación dada” M en el plano 1-2: 


a Do E cos0. seño 0 
A=id e fi, M= ¡seno cosg 01 
g h di 0 0 1 


Escoja el ángulo de rotación 6 para obtener cero en el elemento (3, 1) de M7*4M. 


Nota Esta obtención “de ceros” no es fácil de continuar, ya que las rotaciones produ- 
cen cero en lugar de d y h arruina el nuevo cero en la esquina. Es necesario dejar una 
diagonal abajo de la principal, y terminar el cálculo de los valores característicos de 
alguna otra forma. En caso contrario, si A puede hacerse diagonal y pueden verse sus 
valores característicos, entonces se encontrarían las raíces del polinomio det (A — Af) 
usando sólo las raíces cuadradas que determinan cos 6; lo cual es imposible. 


¿Qué matriz M cambia de la base V, = (1, 1), V, = (1, 4 a la base v, = (2, 5), uv, = 
(1, 4)? Las columnas de M se obtienen al expresar V, y V¿ como combinaciones 2m;,. 
v; de los v's. 


Para las dos mismas bases, exprese el vector (3, 9) como una combinación c,V, + 
c2V2 y también como dv; + d¿uz. Compruebe numéricamente que M relaciona c con 
d: Mc = d. 


Confirme el último ejercicio: Si Y, = m,¡0, + M2102 Y Va = my01 + moa202) Y 
m11Ci + Mi C9 = d; y Ma1C1 Apo Mayta) = d>, los vectores ciV; + CV» y dv + dav, 
son los mismos. Esta es la “fórmula de cambio de base” Mc = d. 


Si la transformación T' es una reflexión, a través de la recta a 45” en el plano, encuen- 
tre su matriz respecto a la base estándar v, = (1, 0), v, = (0, 1), y también respecto a 
V, = (1, D, Va = A, —1). Demuestre que estas matrices son semejantes. 


La transformación identidad lleva cada vector en sí mismo: Tx =.x. Encuentre la ma- 
triz correspondiente, si la primera base es v; = (1, 2), v, = (3, 4) y la segunda base 
es w, = (1, 0), ws, = (0, DD). (¡No es la matriz identidad!) 





13. 


14. 


25. 


16. 


Ez: 


18. 


19. 


20. 


21. 


22. 


23. 


11730 
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La derivada de a + bx +cx? es b+2cx +0x?. 
a) Escriba la matriz de D3 por 3 tal que 


a b 
Dibi=|2l. 
Cc 0 


b) Calcule D*, e interprete los resultados en términos de derivadas. 
c) ¿Cuáles son los valores característicos y los vectores característicos de D? 


Demuestre que todo número es un vector característico para T f(x) = df/dx, pero 
que la transformación Tf(x) = dE F(0Odt no tiene valores característicos (aquí 
=060:< XM.< 00): 


En el espacio de matrices de 2 por 2, sea T la transformación que traspone cada ma- 
triz. Encuentre los valores característicos y las “matrices características” para A* = 
AA. 


a) Encuentre una matriz ortogonal O, de modo que Q7'AQ=A si 


CENAS A 000 
A=|1 1 1 y A=]|0 0 Ol, 
1 A OO TS 


Luego, encuentre un segundo par de vectores ortonormales xy, x, para 4 = 0, 
b) Compruebe que P = xx] +x2x! es el mismo para ambos pares. 


En dos pasos, demuestre que toda matriz unitaria A es diagonalizable: 
i) Si A es unitaria, y U también lo es, entonces T = U”'*AU también es unitaria. 
11) Una T triangular superior que es unitaria debe ser diagonal. Así, T = A. 


Cualquier matriz unitaria A (con valores característicos distintos o no) tiene un con- 
junto completo de vectores característicos ortonormales. Todos los valores caracterís- 
ticos satisfacen |A| = 1. 


Encuentre una matriz normal (VNF? = yHy) que no sea hermitiana, antihermitiana, uni- 
taria, o diagonal. Demuestre que todas las matrices permutación son normales. 


Suponga que T es una matriz triangular superior de 3 por 3, con elementos f;;. Corn- 
pare los elementos de TTF y TT, y demuestre que si son iguales, entonces 7 debe ser 
diagonal. Todas las matrices triangulares normales son diagonales. 


Si N es normal, demuestre que Nx | = |NYx!| para todo vector x. Deduzca que el 
¡-ésimo renglón de N tiene la misma longitud que la ¿¡-ésima columna. Nota: Si N tam- 
bién es triangular superior, esto de nuevo lleva a la conclusión de que debe ser dia- 
gonal. 


Demuestre que una matriz con vectores característicos ortonormales debe ser normal, 
como se establece en ST: Si UT!NU =A, o N = U AUF, entonces NNF = NEN, 


Encuentre una U unitaria y una 7 triangular de modo que UT'AU = T, para 


0.1.0 
A= |; Es y A=|0 0 0l. 
1.0.0 


Si A tiene valores característicos O, 1, 2, ¿cuáles son los valores característicos de 
ACA -— INA - 2D? 
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24. a) Demuestre por multiplicación directa que toda matriz triangular T, por ejemplo de 3 
por 3, satisface su propia ecuación característica (7 — A¡1X<T — A¿IXT — 
Az 1 ) = 0. 
b) Sustituya U7*AU por T para deducir el famoso teorema de Cayley-Hamilton: To- 
da matriz satisface su propia ecuación característica. Para las matrices de 3 por 3, 
esto es (A A DCA —AQDCA — 431) =0. 


a 


25. El polinomio característico de Á = l a esA* — (a + d)A + (ad — bc). Por sus- 
titución directa, compruebe el teorema de Cayley-Hamilton: A? — (a +d)A + 
tad — beyI =0. 

26. Si aj; = 1 arriba de la diagonal principal y a; = O en todas partes, encuentre la forma 


de Jordan (por ejemplo, para matrices de 4 por 4) encontrando todos los vectores ca- 
racterísticos. 





RAI AEREAS 


27. Demuestre al tanteo para una M que ningunas tomadas dos a dos de las tres formas de 
Jordan en la ecuación (8) son semejantes: J, AMTULM,J, A MTM, y 
La A MYIM. 


28. Resuelva u' = Ju por sustitución hacia atrás, resolviendo primero para ux(f): 
du E ES al 4; PEO EX 1 
ra Ju = E l va) con valor inicial u(0) = l 
Observe te* en la primera componente u,(1). 
29. Calcule A y e? si A=MJM”!: 


EI | 


30. Demuestre que A y B son semejantes encontrando una M tal que B = M" AM: 
O Fo 1 
a) a=|| A y B= |; a 
A (fa -1 
0) a= || A y B=|| A: 


212 [a 3 
Él a=|; " y p=|; il 


31. ¿Cuáles de las siguientes matrices A, a Ag son semejantes? 


od lio loo ll lol lo) 


32. Hay 16 matrices de 2 por 2 cuyos elementos son Os y 1s. Las matrices senejantes per- 
tenecen a la misma familia. ¿Cuántas familias hay? ¿Cuántas matrices (en total 16) 
hay en cada familia? 


33. a) Si x está en el espacio nulo de A, demuestre que M”*x está en el espacio nulo de 
M "AM. 
b) Los espacios nulos de A y M”*4M tienen igual(es vectores Xbases (dimensión). 


34. Si A y B tienen exactamente los mismos valores característicos y vectores caracterís- 
ticos, ¿es A = B? Con n vectores característicos independientes, se tiene A = B, En- 
cuentre A * B cuando A = O, O (repetido), aunque sólo hay una línea de vectores 
característicos (x,, 0). 
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Los problemas 35 a 39 son sobre la forma de Jordan. 


33, 


36. 


37. 


38. 


39. 


40. 


41. 


42. 
43. 


Por multiplicación directa, encuentre J? y J? cuando 


ME E: 
pa F a 
Conjeture la forma de J*. Haga k = O para obtener J%. Haga k = —1 para obtener 
Y 
Si J es la matriz de Jordan por bloques de 5 por 5 con A = 0, encuentre J” y cuente 
sus vectores característicos. También encuentre su forma de Jordan (dos bloques). 


En el texto se resolvió du/dt = Ju para una matriz J de Jordan por bloques de 3 por 3. 
Agregue una cuarta ecuación dw/dit = 3w+ x. Siga el patrón de soluciones para z, y, 
x con la finalidad de encontrar w. 


Los valores característicos de las siguientes matrices de Jordan son 0, O, O, O. Las ma- 
trices tienen dos vectores característicos (encuéntrelos). Sin embargo, los tamaños de 
los bloques no coinciden y J no es semejante a K: 





Para cualquier matriz M, compare JM con MK. Si son iguales, demuestre que M no es 
invertible. Luego, M7 *JM = K es imposible. 


Demuestre en tres pasos que A? siempre es semejante a A (se sabe que los As son los 

mismos; el problema son los vectores característicos): 

a) Para A = un bloque, encuentre M, = permutación tal que M*J,M, = J7. 

b) dea = J cualquiera, construya Mo, a partir de bloques, de modo que M¿* J Mo 
=J*, 

c) Para cualquiera A = MJ M”!, demuestre que A* es semejante a J* y que también 
es semejante a J y a 4. 


¿Cuáles de los siguientes pares son semejantes? Escoja a, b, c, d para demostrar que 
los otros pares no lo son: 


Cal lec los o) 


¿Falso o verdadero (proporciona una buena razón)? 

a) Una matriz invertible no puede ser semejante a una matriz singular. 

b) Una matriz simétrica no puede ser semejante a una matriz no simétrica. 
c) Á no puede ser semejante a —A, a menos que A = O, 

d) A — Ino puede ser semejante a A + /. 


Demuestre que A B tiene los mismos valores característicos que BA. 
Si A es de 6 por 4 y B es de 4 por 6, AB y BA son de tamaños distintos. No obstante, 
E Ei le $] E Al => | -G. 
0 l Bo. Ulio, E B BA 
a) ¿De qué tamaño son los bloques de G? Son los mismos en cada matriz. 


b) Esta ecuación es M”*FM = G, de modo que F y G tienen los mismos 10 valores 
característicos. F tiene los valores característicos de AB más 4 ceros; G tiene los 
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valores característicos de BA más 6 ceros. AB tiene los mismos valores característi- 
cos que BA más ceros. 


44. ¿Por qué cada una de las siguientes afirmaciones es verdadera? 
a) Si A es semejante a B, entonces A? es semejante a B?. 
b) A? y B? pueden ser semejantes cuando A y B no son semejantes (intente A = O, O). 


30 : 30 01 
C)jio a«|essemejante alo al 


d) : :] no es semejante a É Sl 
e) Si se intercambian los renglones 1 y 2 de A, y luego se intercambian las columnas 
1 y 2, los valores característicos siguen siendo los mismos. 


Propiedades de los valores característicos y vectores característicos 


¿Cómo se reflejan las propiedades de una matriz en sus valores característicos y vectores 
característicos? Esta cuestión es fundamental en todo el capítulo 5. Una tabla que organi- 
ce los hechos más importantes puede ser de utilidad. Para cada clase de matrices, a conti- 
nuación se presentan las propiedades especiales de los valores característicos A; y los 
vectores característicos x;. 


Simétrica: AT = A A real ortogonal xx; =0 
Ortogonal: Q* = Q”! toda [Af = 1 ortogonal Xx, = 0 
Simétrica sesgada: 4% = —A A imaginaria ortogonal x*x, =0 
Hermitiana compleja: A” =A A real ortogonal Xx? xj =0 
Definida positiva: x" Ax > 0 toda A > 0 

Matriz similar: B = M”"!AM AB) = ACA) xX(B) = MTIUXx(A) 
Proyección: P = P? = p” 1=1;0 espacio de columna; espacio nulo 
Reflexión: 7] — 2uu* A=-—l; 1,..., 1 TEN 

Matriz rango 1: uv! A E O E uy ut 

Inversa: A”) 1/MC A) vectores característicos de A 
Corrimiento: A +c/ AA) +€ vectores característicos de A 
Potencias estables: 47 > 0 toda [A| < 1 


Exponencialmente estable: e* >0  todaRe 1<0 





Markov: m;; > 0, ,_,mij = 1 Amáx = 1 estado estacionario x > O 

Permutación cíclica: P? = [ Ay = e rribn A O 

Diagonalizable: SAS”! diagonal de A las columnas de $ son independientes ? 
Simétrica: QAOQ*? diagonal de A (real) las columnas de Q son ortonormales E 
Jordan: J = MTL AM diagonal de cada bloque de un vector característico 

Cada matriz: A = UYNV? rango (A) = rango (3) los vectores característicos de 


ATA, AA en V,U 








Capítulo 


Ejercicios de repaso 307 


E Ejercicios de repaso 


5.1 Encuentre los valores característicos, los vectores característicos, y la matriz de dia- 
gonalización S, para 


00 0 a 
a=|) >| sl B=(_ E 


5.2 Encuentre los determinantes de A y A”? si 


a Ar Z --1 
as e 


5.3 SiA tiene los valores característicos O y 1, correspondientes a los vectores caracterís- 


ticos 
1 z 
2 y a o 


¿podría decir de antemano que A es simétrica? ¿Cuáles son su traza y su determinan- 
te? ¿Cuál es 4? 


5.4 En el problema previo, ¿cuáles son los valores característicos y los vectores caracte- 
rísticos de A?? ¿Cuál es la relación de 4? con A? 


5.5 ¿Existe una matriz Á tal que toda la familia A + cl es invertible para todos los núme- 
ros complejos c? Encuentre una matriz real con A + rl invertible para todo r real. 


5.6 Resuelva para los dos valores iniciales, y luego encuentre e”*: 


d : : 
li JE si uco) = |, y si uco, = [5 


5.7 ¿Prefiere un interés compuesto trimestralmente a 40% anual o anualmente a 50%? 


5.8 ¿Falso o verdadero? (Proporcione un contraejemplo si es falso): 
a) Si B se forma a partir de A, mediante el intercambio de dos renglones, entonces B 
es semejante a A. 
b) Si una matriz triangular es semejante a una matriz diagonal, ya es diagonal. 
c) Cualesquiera de las dos afirmaciones anteriores implica la tercera: A es hermitia- 
na, Á es unitaria, A? = 1. 
d) SiA y B son diagonalizables, entonces también lo es AB. 


5.9 ¿Qué ocurre a la sucesión de Fibonacci si se retrocede en el tiempo, y cómo está re- 
lacionado F.., con F,? La ley Fy+2 = Fu+i + Fx sigue siendo válida, de modo que 


F,=1. 
5.10 Encuentre la solución general de du/dit = Au si 
0. =l O 
A=|1 a 
O 1 0 


¿Puede encontrar un instante T al que se garantice que la solución (7) vuelva al va- 
lor inicial (0)? 
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5.11 Si P es la matriz que proyecta R” sobre un subespacio $, explique por qué todo vec- 
tor en S es un vector característico, y así como cada vector en S+. ¿Cuáles son los va- 
lores característicos? (Observe la relación con P? = P, lo que significa que 1? = A.) 


5.12 Demuestre que toda matriz de orden > 1 es la suma de dos matrices singulares. 


5.13 a) Demuestre que la ecuación diferencial matricial dX/dt = AX + XB tiene la solu- 
ción. X(1) =e* X(Me?*. 
b) Demuestre que las soluciones de dX/dt = AX — XA preservan los mismos valores 
característicos para todos los instantes. 


5.14 Si los valores característicos de A son 1 y 3 con vectores característicos (5, 2) y (2, 1), 
encuentre las soluciones de du/dt = Au y uz,; = Au, empezando con u = (9, 4). 


5.15 Encuentre los valores característicos y los vectores característicos de 


O 510 
A=]1 La 
a E 


¿Qué propiedad se espera tengan los vectores característicos y es verdadera? 


5.16 Intente resolver lo siguiente para demostrar que A no tiene raíz cuadrada. 


le «plo al=lo o]=a 


Cambie los elementos en la diagonal de A a 4 y encuentre una raíz cuadrada. 


04 
5.17 a) Encuentre los valores característicos y los vectores característicos de Á = : z > ; 


b) Resuelva du/dt = Au empezando con u(0) = (100, 100). 

c) Si v(t) = ganancia de los corredores de bolsa y w(f) = ganancia del cliente, y am- 
bos se ayudan mutuamente mediante du/dt = 4w y dw/dt = 3 v, ¿a que tiende la 
razón v/w cuando t —>00? 


5.18 ¿Falso o verdadero? (Proporcione una razón si es verdadero y un contraejemplo si es 

falso). 

a) Para toda matriz A, hay una solución de du/dt = Au empezando con u(0) = 
E 6 

b) Toda matriz invertible puede diagonalizarse. 

c) Toda matriz diagonalizable puede invertirse. 

d) El intercambio de los renglones de una matriz de 2 por 2 invierte el signo de sus 
valores característicos. 

e) Sí los vectores característicos x y y corresponden a valores característicos distin- 
tos, entonces “y = 0, 


5.19 Si Kes una matriz simétrica sesgada, demuestre que O = (1 — K)IU + K)7* es una ma- 
o 2 


triz ortogonal. Encuentre Q si K = le ol- 
5.20 Si K* = —K (hermitiana sesgada), los valores característicos son imaginarios y los 
vectores característicos son ortogonales. 
a) ¿Cómo se sabe que K — / es invertible? 
b)' ¿Cómo se sabe que K = U AU? para una matriz U unitaria? 
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c) ¿Por qué es unitaria e%*? 


d) ¿Por qué es unitaria e**? 


5.21 Si Mes la matriz diagonal con elementos d, d”, d?, ¿cuál es M”*4M? ¿Cuáles son sus 
valores característicos en el siguiente caso? 


A: E 
A=141 1d 
: US AU 
522 S1A? =—L ¿cuáles son los valores característicos de A? Si A es una matriz real de n 


por 1, demuestre que » debe ser par, y proporcione un ejemplo. 
5.23 SiAx =2Aix y AT y = Ay (todos reales), demuestre que x*y = O. 
5.24 Una variante de la matriz de Fourier es la “matriz seno”: 


senó  sen209 sen30 
S=-—_=|sen?9 sen49 sen60 con 0O= 
y2 sen30 sen69 sen 


SE 


Compruebe que S* = S”!. (Las columnas son los vectores característicos de la ma- 
triz tridiagonal — 1, 2, —1). 


5.25 a) Encuentre una matriz N diferente de cero tal que NW = 0, 
b) Si Nx = Ax, demuestre que A debe ser cero. 
c) Demuestre que N (denominada “matriz nilpotente”) no puede ser simétrica. 


5.26 a) Encuentre la matriz P = aa*/a*a que proyecta cualquier vector sobre la recta que 
pasa por a = (2, 1, 2). 
b) ¿Cuál es el único valor característico diferente de cero de P, y cuál es el vector ca- 
racterístico correspondiente? 
c) Resuelva uz, = Puy, empezando con uy = (9, 9, 0). 


5.27 Suponga que el primer renglón de A es 7, 6 y que sus valores característicos son l, —1. 
Encuentre Á. 


5.28 a) ¿Para qué números c y d ocurre que A tiene valores característicos reales y vecto- 
res característicos ortogonales ? 


dr 0 
A= 2 d c 
SN E 


b) ¿Para cuáles c y d es posible encontrar tres vectores ortonormales que sean com- 
binaciones de las columnas? (¡No lo resuelva!) 


5.29 Si los vectores x, y x¿ están en las columnas de $, ¿cuáles son los valores caracterís- 
ticos y los vectores característicos de 


| 
a 2 lo —= 2 3 ns) | 
a=s!; E y B=5|; | h | 


k 
5.30 ¿Cuál es el límite cuando k -> 00 (el estado estacionario de Markov) de Le 0% (5)? 









ns 
vd 0 
ads 
5 E e 
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Matrices positivas definidas 


6.1 MÍNIMOS, MÁXIMOS, Y PUNTOS SILLA 


Hasta el momento, difícilmente se ha pensado en los signos de los valores característicos. 
No es posible preguntar si A es positivo antes de saber si es real. En el capítulo 5 se esta- 
bleció que toda matriz simétrica tiene valores característicos reales. A continuación se 
encontrará una prueba que puede aplicarse directamente a A, sin calcular sus valores carac- 
terísticos, que garantizará que todos estos valores característicos son positivos. Esta prue- 
ba conlleva tres de los conceptos más importantes del libro: pivotes, determinantes y 
valores característicos. 

A menudo, el signo de los valores característicos es crucial. Para estabilidad en ecua- 
ciones diferenciales, se requieren valores característicos negativos, de modo que e”* decai- 
ga. El nuevo y muy importante nuevo problema es reconocer un punto mínimo. Esto se 
presenta en toda la ciencia e ingeniería, así como en todo problema de optimización. El pro- 
blema matemático es mover la prueba de la segunda derivada F” > O hacia n dimensiones. 
A continuación se presentan dos ejemplos: 


Fíx, y) =7 +2(x + yy — y sen y — x? flx, y) = 2x1? + 4xy + ye 
Ya sea Fíx, y) O f(x, y), ¿tiene un punto mínimo en x = y = 0? 


Observación 1 Los términos de orden cero F(0, 0) = 7 y F(0, 0) = O no afectan la res- 
puesta. Simplemente suben o bajan las gráficas de F y f. 


Observación 2 Los términos lineales proporcionan una condición necesaria: A fin de 
tener alguna posibilidad de un mínimo, las primeras derivadas deben hacerse cero en 
=y=0: 


9oF 
O y 


0 e) 
AO y A Todo cero. 
0x dy 


_— = Ax + y) — ycos y —seny =0 
9y 


Así, (x, y) = (0, 0) es un punto estacionario para ambas funciones. La superficie z = Fx, 
y) es tangente al plano horizontal z = 7, y la superficie z = f(x, y) es tangente al plano 
z = 0. La cuestión es si las gráficas pasan o no por arriba de esos planos, a medida que 
se aleja el punto de tangencia x = y = O. 
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Observación 3 Las segundas derivadas en (0, 0) son decisivas: 

















02F o-f 
9x2 É 9x2 
dep” _i00h = 0 NTE: 5: 
Oxdy  0y09x dxdy  Iydx 
0*F a? 
O => 


Estas segundas derivadas 4, 4, 2 contienen la respuesta. Debido a que son las mismas pa- 
ra F y para f, deben contener la misma respuesta. Las dos funciones se comportan exac- 
tamente de la misma manera cerca del origen. F tiene un mínimo si y sólo si f tiene un 
mínimo. ¡Se demostrará que estas funciones no lo hacen! 


Observación 4 Los términos de orden superior en F no afectan la cuestión de un mí- 
nimo local, aunque pueden impedir que éste se convierta en un mínimo global. En el 
ejemplo, el término —x7 tarde o temprano empujará a F hacia —oo. Para f(x, y), sin tér- 
minos superiores, toda la acción está en (0, 0). 

Toda forma cuadrática f = ax? + 2bxy + cy? tiene un punto estacionario en el ori- 
gen, donde 9f/9x = 9f/0y = O. Un mínimo local también debe ser un mínimo global. 
Entonces, la forma de la superficie z = f(x, y) es como la de un tazón, apoyado en el ori- 
gen (véase la figura 6.1). Si el punto estacionario de F está en x = a, y = É, el único 
cambio es en el uso de las segundas derivadas en a, B: 


Parte 
cuadrática — f(x, y) = 


2 2 y 92 EF 
de F 2 


92F 9*F 
Ed TA dy AA ARA 


2 
IXxdy Z 


Cerca de (0, 0), está f(x, y), y se comporta de la misma forma en que F(x, y) se compor- 
ta cerca de (a, 8). 


Las terceras derivadas hacen su aparición en el problema cuando las segundas deriva- 
das fracasan en proporcionar una decisión definitiva. Esto ocurre cuando la parte cuadrá- 
tica es singular. Para un mínimo verdadero, se permite que f sea cero sólo en x = y = 0. 






Figura 6.1 Tazón y silla: A = | : 4 definida y 4 = E 





Ejemplo 1 


Ejemplo 2 
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Cuando f(x, y) es estrictamente positiva en todos los demás puntos (el cuenco del tazón 
está hacia arriba), se denomina positiva definida. 


Definida contra indefinida: tazón contra silla 


El problema se reduce a lo siguiente: Para una función de dos variables x y y, ¿cuál es la 
sustitución correcta para la condición 9? F/9 x? > 0? Con una sola variable, el signo de 
la segunda derivada decide entre un mínimo o un máximo. Ahora se cuenta con tres se- 
gundas derivadas: F yx, F yy = Fyx y Fyy Estos tres números (como 4, 4, 2) deben deter- 
minar si F (igual que f') tiene o no un mínimo. 

¿Qué condiciones sobre a, b y c aseguran que la cuadrática f(x, y) = ax* + 2bxy 
+ cy? es positiva definida? Una condición necesaria es fácil: 


1) Siax? + 2bxy + cy? es positiva definida, entonces necesariamente a > 0. 


Se considera x = 1, y = 0, donde ax? + 2bxy + cy? es igual a a. Ésta debe ser positiva. 
Trasladando de vuelta a F, lo anterior significa que 9? F/9x? > 0. La gráfica debe ser 
hacia arriba en la dirección x. De manera semejante, se fija x = O y se considera la di- 
rección y, donde f(0, y) = cy?: 


11) Si f(x, y) es positiva definida, entonces necesariamente c > 0. 


¿Estas condiciones sobre a > 0 y c > 0 garantizan que f(x, y) siempre es positiva? La res- 
puesta es mo. Un gran término cruzado 2bxy puede empujar la gráfica por abajo de cero. 


Fix, y) =x-10xy + y”. Aquí a = 1 y c = 1 son ambas positivas. Sin embargo, fno es po- 
sitiva definida, ya que f(1, 1) = —8. Las condiciones a > O y c > O aseguran que f(x, y) 
es positiva en los ejes x y y. Pero la función es negativa sobre la recta x = y, porque b = 
—10 supera a a y c. 


En la f original, el coeficiente 2b = 4 era positivo. ¿Esto asegura un mínimo? De nue- 
yo la respuesta es no; ¡el signo de b carece de importancia! Aunque sus segundas deri- 
vadas son positivas, 2x* + 4xy + y? no es positiva definida. Ni F ni f tienen un mínimo 
en (0, 0) porque FA, 1D) =2-4+w1=-i, 


Lo que debe controlarse es el tamaño de b, en comparación con a y c. Ahora se 
quiere una condición necesaria y suficiente para la condición de positiva definida. La téc- 
nica más simple es completar el cuadrado: 


Expresar f(x, y) DE p? 

usando f=ax*+2bxy+cy=alx+=y] +le=—=]lyY. (0) 
, a a 

cuadrados 


El primer término a la derecha nunca es negativo, cuando el cuadrado se multiplica por 
a > 0, Pero este cuadrado puede ser cero, y entonces el segundo término debe ser posl- 
tivo. El coeficiente de ese término es (ac — b?) 0 a. El último requerimiento para la condi- 
ción de positiva definida es que este coeficiente debe ser positivo: 


iii) Si ax? + 2bxy + cy? permanece positiva, entonces necesariamente ac > b”. 


Ea ai A 


nea li 
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Prueba para un mínimo: Las condiciones a > 0 y ac > b* son correctas. Garantizan c > 0. : E 
El miembro derecho de (2) es positivo, y se ha encontrado un mínimo: E 






-6A. a + Foro E y es s positiva definida si E a>0yc ac e 4 Cualquier 


o er par [Py 
1d dx] ay _ L1dx0y AER 


Prueba para un máximo: Debido a que f tiene un máximo siempre que -f tiene un mí- 
nimo, simplemente se invierten los signos de a, b y c. Esto en realidad deja ac > b? sin 
cambio: la forma cuadrática es negativa definida si y sólo si a < O y ac > b?. El mismo 
cambio es válido para un máximo de F(x, y). 












Caso singular ac = b?: El segundo término en la ecuación (2) desaparece para dejar só- 

lo el primer cuadrado, que es positivo semidefinido, cuando a > O, o negativo semidefini- 

do, cuando a < O. El prefijo semi permite la posibilidad de que F' pueda ser igual a cero, 
como es el caso en el punto x = b, y = —a. La superficie z = f(x, y) degenera de un tazón E 
en un valle. Para f = (x + y), el valle se encuentra a lo largo de la recta x + y = 0. Jj 


Punto silla ac < b?: En una dimensión, F(x) tiene un mínimo o un máximo, o bien, 
F" = (. En dos dimensiones, permanece una posibilidad bastante importante: la combina- 
ción ac — b? puede ser negativa. Esto ocurrió en los dos ejemplos, cuando b dominaba a a 
y c. Esto también ocurre si a y c tienen signos opuestos. Así, dos direcciones proporcionan 
resultados opuestos: en una dirección, f crece; en la otra, decrece. Resulta de utilidad con- 
siderar dos casos especiales: 


Puntos silla en (0,0) f=2y y A=xX-yY y ac-b?=- 


En el primero, b = 1 domina a = c = O. En el segundo, a = 1 y c = —1 tienen signos 
opuestos. Los puntos silla 2xy y x? — y? son prácticamente los mismos; si uno se hace gi- 
rar 45%, se obtiene el otro. También es difícil trazarlos. 

Estas formas cuadráticas son indefinidas, porque pueden asumir cualquier signo. Así, 
se tiene un punto estacionario que no es máximo ni mínimo. Se denomina punto silla. La 
superficie z = x? — y? va hacia abajo en la dirección del eje y, donde sus piernas se ajustan 
(si usted ha montado a caballo). En caso de que usted haya cambiado a un automóvil, pien- 
se en una carretera que va por un paso de montaña. La cima del paso es un mínimo mien- 
tras se observa a lo largo de la cordillera, aunque es un máximo cuando usted avanza por 
la carretera. 


Dimensiones superiores: álgebra lineal ] 


El cálculo podría bastar para encontrar nuestras condiciones F,. > 0 y Fi¿rF,y > ¡de 
para un mínimo. Sin embargo, el álgebra lineal está preparada para hacer más, ya que las 
segundas derivadas se ajustan a una matriz simétrica A. Los términos ax? y cy? aparecen 
sobre la diagonal. La derivada cruzada 2bxy está separada entre el mismo elemento b arri- 





Ejemplo 3; -2:2+4xy + y? y a=| 


A E A E O BAS y A 8 A ME E $ 
A A AA E pod oí cd 
, - . A A E MS 4 es RESIONAL 
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É ¿0 ájo: ¡Una cuadrática f(x, y). proviene direchimentedbiina matriz simétrica de 2 por 2! 


T 2 2 2_ a b| ix 
x*AxenkR aX LD Y OY =|x y | P 4 7. (4) 
Esta identidad (por favor, realice el producto) constituye la clave para todo el capítu- 
lo. Se generaliza de inmediato a n dimensiones, y constituye una abreviación perfecta pa- 
ra estudiar máximos y mínimos. Cuando las variables son x;,...,X,, van en un vector 
columna x. Para cualquier matriz simétrica A, el producto x"Ax es una forma cuadráti- 
ca pura (Xy ..., Xy): 


41 03 >: Gin X| AS 
a as) . a XxX 
FAGOR. da al an z => > ayjXxixj. (5) 
fe] [m1] 
Qn1 4n2 y Cnn Xn 


Los elementos diagonales a;; a 4,,, multiplican Y xo El par a, = a, se combina en 
244X:X ASÍ, f = ayx? + 2a1911%2 + *** Pb annx?. 

No hay términos de orden superior ni términos de orden inferior; sólo de segundo or- 
den. La función es cero en x = (0,..., 0), y sus primeras derivadas son cero. La tangente 
es plana; se trata de un punto estacionario. Es necesario decidir six = O es un mínimo, un 
máximo o un punto silla de la función f= x*Ax. 


2 


2 -—> punto silla 
A) P : 


Ejemplo 4 f=2xy y A= h o! > punto silla. 


Ejemplo 5 


A es de 3 por 3 para 2x1? — 2x 1x2 + 2x2 — 2x2x3 + 2x2: 


Z ==] 0 X1 
f=[x Xo x3 ] =s] a] x,| —> mínimo en (0, 0, 0). 
0 0 =1i Z X3 


Cualquier función F(x;, .. ., Xx) es aproximada de la misma forma. En un punto esta- 
cionario todas las primeras derivadas son cero. A es la “matriz segunda derivada” con ele- 
mentos ay = 9?F/9 x,0x;- Esto automáticamente es igual a q; = 9? F/9x,0x¡, de modo 
que A es simétrica. Así, F tiene un mínimo cuando la cuadrática pura x*Ax es positiva 
definida. Estos términos de segundo orden controlan a F cerca del punto estacionario: 


1 E 
Serie de Taylor F(x) = F(0) +xgrad F) + ¿Ax + términos de orden superior. (6) 


En un punto estacionario, F = (9F/9x,,...,9F/09x,) es un vector de ceros. Las segun- 
das derivadas en x"Ax asumen la gráfica hacia arriba, hacia abajo (o en una silla). Si el pun- 
to estacionario está en xy en vez de en O, entonces F(x) y todas las derivadas se calculan en 
Xp. Luego, x cambia a x — xy en el miembro derecho. 

La siguiente sección contiene las pruebas para decidir si x"Ax es positiva (el tazón se 
dirige hacia arriba a partir de x = 0). De manera equivalente, las pruebas deciden si la 
matriz A es positiva definida, lo cual constituye el objetivo más importante del capítulo. 


A AAA 
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Conjunto de problemas 6.1 


L 


pa 


10, 


11. 


La cuadrática f = x* + 4xy + 2y? tiene un punto silla en el origen, a pesar de que sus 
coeficientes son positivos. Escriba fcomo una diferencia de dos cuadrados. 


Decida a favor o en contra de la condición de positiva definida de las siguientes ma- 
trices, y escriba las f = xTAx correspondientes: 


1 Lo IAS =1 2 
os ola) obs 012) 
El determinante en el inciso b) es cero; ¿a lo largo de cuál recta se encuentra f(x, y) = 07 
Si una matriz simétrica de 2 por 2 satisface las pruebas a > 0, ac > b?, resuelva la 
ecuación cuadrática det (A — AD = 0, y demuestre que los dos valores característicos 
son positivos. 
Decida entre un mínimo, un máximo o un punto silla para las siguientes funciones. 
a) F=-—1+4(e* —-x)- 3x sen y + 6y” en el punto x = y = 0. 
b) F = (1 - 2x)cos y, con punto estacionario enx = l, y = 7. 


a) ¿Para cuáles números b se cumple que la matriz A = A | es positiva definida? 


b) Factorice A = LDL* cuando b está en el intervalo para la propiedad de positiva de- 
finida. 

c) Encuentre un valor mínimo de ¿(x? + 2bxy + 9y?) — y para b en este intervalo. 

d) ¿Cuál es el mínimo si b = 37? 

Suponga que los coeficientes positivos a y c dominan a b en el sentido de que a + 

c > 2b. Encuentre un ejemplo que tenga ac < b*, de modo que la matriz no sea posi- 

tiva definida. 


a) ¿Cuáles matrices simétricas de 3 por 3 A, y A, corresponden af, y f,? 
f=xiH+xdt xd 2x1 — 2x1%3 + 2x2X3 
fa =x24+2x2 + 11x2 — 2x1x2 — 2x1Xx3 — 4x2X3. 

b) Demuestre que f, es una matriz cuadrado perfecto simple y no positiva definida. 


¿Dónde ocurre que f, es igual a 0? 
c) Factorice A, en LL*. Escriba f, = x"Azx como una suma de tres cuadrados. 


SiA = E 4 es positiva definida, pruebe A”! = E 2] en cuanto a esta propiedad. 


sl 
La cuadrática f(x1,x2) = 3x1 + 2x2 + 4x2 es positiva. Encuentre su matriz A, 
factorícela en LDL*, y relacione los elementos en D y Lcon3,2,4en f. 


SiR= E E , escriba R? y compruebe que es positiva definida a menos que R sea 


singular. 

a SiA= E 4 es hermitiana (b complejo), encuentre sus pivotes y su determi- 
nante. 

b) Complete el cuadrado para 1%4x. Ahora x* = [X, 2 |] puede ser compleja. 


a|x1J? + 2RebX,xz + cl xl? =alx¡ + (b/a)x21* + [x2 4. 





c) Demuestre que a > 0 y ac > Jb[* aseguran que A es positiva definida. 


| re 3. 44 e ] 
d) Las matrices |; o y pe ¿* |, ¿son positivas definidas? 
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12. Decida si f = x?y? — 2x — 2y tiene un mínimo en el punto x = y = 1 (después de 
demostrar que las primeras derivadas son cero en ese punto). 

13. ¿En qué condiciones sobre a, b, c se cumple que ax? + 2bxy + cy? > x? + y? para 
toda x, y? 


Los problemas 14 a 13 son sobre pruebas para la propiedad de positiva definida. 


14. ¿Cuáles de A,, 4), A3, As tienen dos valores característicos positivos? Pruebe a > 0 
y ac > b?; no calcule los valores característicos. Encuentre una x, de modo que 
Ax < 0. 


A ET 0 ap o (80! 10 E E: 10 
E E 5 m0 je $e A Pe de! teta ln edi 
15. ¿Cuál es la cuadrática f = ax? + 2bxy + cy? para cada una de las siguientes matri- 


ces? Complete el cuadrado con la finalidad de escribir f como una suma de uno o dos 
cuadrados di( )?.+dal )?. 


E a Ud. OS 
lá» «Ls 


16. Demuestre que f(x, y) = x? + 4xy + 3y? no tiene un mínimo en (0, 0) incluso si 
sus coeficientes son positivos. Escriba f como una diferencia de cuadrados y encuen- 
tre un punto (x, y) donde f es negativa. 


17. (Importante) Si A tiene columnas independientes, entonces ATA es cuadrada, simétri- 
ca e invertible (véase la sección 4.2). Vuelva a escribir x"ATAx para demostrar por 
qué es positiva, excepto cuando x = 0. Entonces, ATA es positiva definida. 


18. Pruebe si AA es positiva definida en cada caso: 


1 
UE. [E ME EE vd NE: ES 
A=|) + A=|1 2l, y A Met 
| 
19. Encuentre la matriz A de 3 por 3, sus pivotes, rango, valores característicos, y deter- 
minante: 
X1 
[x1 X2 x3 | Á xl =4(x, — xo + 2x3). 
X3 


20. Para Fi(x, y) = jx*+x%y+y y Fax, y) = x? + xy — x, encuentre las ma- 

trices segunda derivada A, y Az: 
_ | 9%F/9x* a%F/9x0y 
9F/29ydx 9*F/0y | 

A, es positiva definida, de modo que F, es cóncava hacia arriba (= convexa). Encuen- 
tre el punto mínimo de F, y el punto silla de F» (analice, dónde las primeras deriva- 
das son cero). 

21. La gráfica de z = x? + y? es un tazón que se abre hacia arriba. La gráfica de 
z = x? — y? es una silla. La gráfica de z = —x? — y? es un tazón que se abre hacia 
abajo. ¿Cuál es una prueba sobre F(x, y) para tener una silla en (0, 0)? 


22. ¿Con qué valores de c se obtiene un tazón, y con cuáles un punto silla para la gráfica 
de z = 4x? + 12xy + cy?? Describa esta gráfica en el valor fronterizo de c. 
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6.2 PRUEBAS PARA COMPROBAR Si UNA MATRIZ ES POSITIVA DEFINIDA 


¿Cuáles son las matrices simétricas que poseen la propiedad de que x*Ax > 0 para todos los 
vectores x diferentes de cero? Hay cuatro o cinco formas distintas para contestar esta pre- 
gunta, y esperamos encontrarlas todas. La sección previa empezó con algunas sugerencias 
sobre los signos de los valores característicos, aunque ello originó las pruebas sobre a, b, c: 





a b dE 
A = | b el es positiva definida cuando a >0 y  ac—b*>0. 
A. partir de estas condiciones, ambos valores característicos son positivos. Su producto 
AA, es el determinante ac — b? > 0, de modo que los valores característicos son ambos po- 
sitivos o ambos negativos. Deben ser positivos porque su suma es la traza a + c > 0, 

Al considerar a y ac — b?, incluso es posible pronosticar la apariencia de los pivotes. 
Éstos aparecieron cuando x"Ax se descompuso en una suma de cuadrados: 

2 
acabo y 


2 
Suma de cuadrados ax? +2bxy + cy? =a (> + -») + _—_—_— y? (1) 
a a 


Estos coeficientes a y (ac — b*)/a son los pivotes para una matriz de 2 por 2. Para matri- 
ces más grandes, los pivotes siguen constituyendo una prueba para comprobar si una ma- 
triz es positiva definida: x"Ax es positiva cuando n cuadrados independientes se multiplican 
por pivotes positivos. 

Una observación preliminar más. Las dos partes de este libro se vincularon mediante 
el capítulo sobre determinantes. En consecuencia, se pregunta cuál es el papel que desem- 
peñan los determinantes. No basta requertr que el determinante de A sea positivo. Sia = 
c=-—1yb=0, entonces det A = 1, peroA = —] = negativa definida. La prueba del de- 
terminante se aplica no sólo a A misma, para obtener ac — b? > O, sino también a la sub- 
matriz a de 1 por 1 que está en la esquina superior izquierda. 

La generalización natural implica a todas las n de las submatrices superiores izquier- 
das de A: 


a a a A An = Á. 
a 21 22 23 |, , n 


dia dí 4033 
a día 
Al 

da dz 33 


A1 =layl, Az = | 


A continuación se presenta el teorema principal sobre la comprobación de si una ma- 
triz es E ic así como una demostración razonablemente detallada: 


JN e e la matriz A real 1 positiva ss 
io sl ; di 


ss 
dj 
> 





Demostración La condición I define una matriz positiva definida. El primer paso es de- 
mostrar que cada valor característico es positivo: 


Si Ax =1Ax, entonces x* Ax =x*1x = Allx11?. 


Una matriz positiva definida tiene valores característicos positivos, ya que xTAx > 0. 





Ejemplo 1 
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A continuación se procede en la otra dirección. Si todos los A, > O, es necesario de- 
mostrar que x"Ax > O para todo vector x (no sólo para los vectores característicos). Debi- 
do a que las matrices simétricas tienen un conjunto completo de vectores característicos 
ortonormales, cualquier x es una combinación c,Xx¡ + *** +C,Xp. Luego, 


Ax = C¡AÁX; Ap as + Cr ÁXy PS C1A1xX] A Ciao 


Debido a la ortogonalidad, x"x, = 0, y la normalización xIx, = 1, 


Í 
AA EA CA) 
= cid hor + cd (2) 
Si todo A, > 0, entonces la ecuación (2) demuestra que xYAx > 0. Así, la condición H im- 
plica la condición L. 

Si la condición Í se cumple, entonces también se cumple la condición IIf. El determi- 
nante de Á es el producto de los valores característicos. Y si la condición I se cumple, ya 
se sabe que estos valores característicos son positivos. Pero también debe tratarse con toda 
submatriz superior izquierda A¿. El truco consiste en considerar a todos los vectores dife- 
rentes de cero cuyas últimas n — k componentes sean cero: 

xXAx = [x7 0] lg | El = Xo AgXe > 0. 
Así, A, es positiva definida. Sus valores característicos (¡no los mismos A!) deben ser po- 
sitivos. Su determinante es su producto, por lo que todos los determinantes izquierdos su- 
periores son positivos. 

Si la condición UI se cumple, entonces también se cumple la condición IV: Según la 
sección 4.4, el k-ésimo pivote d, es la razón de det A, a det Aj... Si todos los determinan- 
tes son positivos, también lo son los pivotes. 

Si la condición IV se cumple, entonces también se cumple la condición I: Se cuenta 
con pivotes positivos, y es necesario deducir que x"Ax > O. Esto fue lo que se hizo en el 
caso de 2 por 2 al completar el cuadrado. Los pivotes eran los números fuera de los cua- 
drados. Para ver cómo ocurre lo anterior para niatrices simétricas de cualquier tamaño, se 
regresa a la eliminación de una matriz simétrica: A = LDL”. 


; e ES 
Pivotes positivos 2, 5 y 3: 


a EL, 1 SN E Ln 0 
AS 2 ASA 10 z O 1 -2|=LDfÍ. 
0-1. 2 O -2 1 O | 
Se busca separar "Ax en *LDELTx: 
e 1 => 0 u es zu 
Six = | v|, entonces Lx = | 0 1 —$ v| = |v—3w 
ss 0 0 1 w w 
Así, x"Ax es una suma de cuadrados con los pivotes 2, 5 y 2 como coeficientes: 
REA o 
x Ax = UA D(I*x) = 2 (s — 3») + 3 ( — 32) + ZW). 
Estos pivotes positivos en D multiplican cuadrados perfectos para hacer positiva a x Ax. 
Así, la condición IV implica la condición I, y la demostración está completa. E 


Es hermoso que la eliminación y la completación al cuadrado sean realmente lo mismo. 
La eliminación retira a x, de todas las ecuaciones posteriores. De manera semejante, el primer 
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cuadrado explica todos los términos en x"Ax que implican a x,. La suma de cuadrados tie- 
ne a los Pates eS ¡Los multiplicadores £ , están dentro! En el ejemplo, puede ver los 
números — > ES 2 dentro de los cuadrados. 

Todo Plemenio diagonal a, debe ser positivo. Como se sabe por los ejemplos, no obs- 
tante, es mucho más que suficiente observar sólo los elementos en la diagonal. 

Los pivotes d, no deben confundirse con los valores característicos. Para una matriz 
positiva definida típica, se trata de dos conjuntos completamente distintos de números po- 
sitivos. En el ejemplo de 3 por 3, quizá la prueba más fácil sea la del determinante: 


Prueba del determinante det A, = 2, det A, = 3, det Az = detA = 4. 


Los pivotes son las razones dí; = 2, d¿ = 3» dz = 5 Normalmente, la prueba de los valo- 
res característicos es el cálculo más largo. Para esta A se sabe que todos los As son positivos: 


Prueba del valor característico 4; = 2 — Y2 2=2, li=2+vV2, 


Aunque es la más difícil de aplicar a una simple matriz, la prueba de los valores caracte- 
rísticos puede ser la de más utilidad para efectos teóricos. Cada prueba es suficiente por 
sí misma. 


Matrices positivas definidas y mínimos cuadrados 


Espero que el lector permita la presentación de una prueba más para comprobar si una ma- 
triz es positiva definida. Dicha prueba está muy próxima. Las matrices positivas definidas 
se relacionaron con los pivotes (véase el capítulo 1), los determinantes (véase el capítulo 4) 
y con los valores característicos (véase el capítulo 5). Ahora se les ve en los problemas de 
mínimos cuadrados del capítulo 3, provenientes de las matrices rectangulares del capítulo 2. 
La matriz rectangular será R y el problema de mínimos cuadrados será Rx = b. Tiene 
m ecuaciones con m = n (se incluyen los sistemas cuadrados). La elección por mínimos 
cuadrados X es la solución de RTRX = RTb, Esta matriz A = RYR no sólo es simétrica, 
sino que también es positiva definida, como se demostrará a continuación, en el supuesto 
de que las 1 columnas de R sean linealmente ES 
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am, Existe u una : matriz Re con n Columnas independientes tal que A = > ER, 
La clave consiste en reconocer a xPAx como x"RTRx = (Rx) (Rx). Esta longitud al cua- 
drado || Rx|[? es positiva (a menos que x = 0), porque las columnas de R son independien- 
tes. (Si x es diferente de cero, entonces Rx es diferente de cero.) Así, xTRTRx > 0 y RR 
es positiva definida. 
Queda por encontrar una R para la cual A = RYR. Esto ya se hizo dos veces: 


Eliminación — A=LDL" =(LYDXVDL”). Así, tomar R= VDE. 
Esta descomposición de Cholesky tiene separados los pivotes equitativamente entre £ y £*. 
Valores característicos A=QA0* =(O0VYAN AQ). Así, tomar R=VAQT. (3) 


Una tercera posibilidad es R = OY AQ, la raíz cuadrada positiva definida simétrica de 
A. Hay muchas otras opciones, cuadradas o rectangulares, que pueden verse. Si cualquier 
R se multiplica por una matriz O con columnas ortonormales, entonces (ORIC(OR) = 
RTOFOR =RTIR = A. En consecuencia, OR es otra opción. 

Aplicaciones de las matrices positivas definidas se presentan en mi libro anterior 
Introduction to Applied Mathematics y también en el nuevo Applied Mathematics and 





Ejemplo 2 
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Scientific Computing (consulte la página www. wellesleycambridge. com). Se mencio- 
na que Ax = AMx se presenta constantemente en análisis ingenieril. S1 A y M son positivas 
definidas, este problema generalizado es paralelo al conocido Ax = Ax, y A > 0. Mes una 
matriz masa para el método de elementos finitos de la sección 6.4. 


Matrices semidefinidas 


Las pruebas para comprobar si una matriz es positiva definida relajan xAx > 0,1 > 0, 
d > 0, y det > O, para dejar que aparezcan ceros. La cuestión principal es ver analogías con 
el caso positiva definida. 





La a disgonalización de A = QA OTE SS ax Ax =x QA 2. As Si el rango de 
Aesr,eny Ay = Ay? + >> +A, y? hay r As diferentes de cero y r Eds perfectos. 


Nota La novedad es que la condición Hl' es válida para todas las submatrices principales, 
no sólo para aquellas que están en la esquina superior izquierda. En caso contrario, no se- 
ría posible distinguir entre dos matrices cuyos determinantes superiores izquierdos fuesen 
todos cero: 


UN 1 da 


Para mantener la simetría, un intercambio de renglones va acompañado de un intercambio 
de columnas. 


o 4 es positiva semidefinida, y o "4 es negativa semidefinida. 


A | 
A=|-l 2 —1| es positiva semidefinida, por todas las cinco pruebas: 
a E! Z 


DM Ax = (a —x2)+(x — 33 + (22 — 13)? > 0 (cero six, = x2 = 23). 
(1 Los valores característicos son A; = 0,47 = 43 = 3 (y cero los valores característicos). 
(UP) det 4 = 0 y los determinantes menores son positivos. 


2 -1 -1 20 0 A 
am) a=|-1 2 -1|>|0 2 72¡>]|0 3 0] (pivote faltante). 
es: ES 0-5 3 0.0.0 
(Y A = RYR con columnas dependientes en R: 
2-1 -1 lo-1 0JP.1 0-1 
==] 2 —-1li=]| O 1 —14|-—1 1 Ol (1,1, D) enel espacio nulo. 


e A Z Al 0 1 0. =1 1 


—— SEP 


A —— e 
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Ejemplo 3 


Observación Las condiciones para que una matriz sea semidefinida también pudieron de- 
ducirse de las condiciones originales l a V sí se usa el siguiente truco: Sumar un pequeño 
múltiplo de la identidad para obtener una matriz positiva definida A +€/f. Luego, € tien- 
de a cero. Debido a que los determinantes y los valores característicos dependen continua- 
mente de e = O, son positivos hasta el último momento. En € deben seguir siendo no 
negativos. 


A menudo, mis alumnos me preguntan sobre matrices positiva definida no simétricas. 
Nunca se utiliza este término. Una definición razonable es que la parte simétrica ¿(A +A?) 


debe ser positiva definida. Eso garantiza que las partes reales de los valores característi- 


cos son positivas. Aunque esto no es necesario: Á = É +] tiene A > O pero ¿(A +A?) 


En E , es indefinida. 


Si Ax =Ax, entonces xXHAx =AxHx y x*HAHx =ixHx, 
Al sumar ¿xE(A + AB)x =(Redax x > 0 de modo que Rea > 0. 


Elipsoides en n dimensiones 


En todo este libro, la geometría ha sido de ayuda para el álgebra de matrices. Una ecuación 
linea! produjo un plano. El sistema Ax = b proporciona una intersección de planos. Los mí- 
nimos cuadrados proporcionaron una proyección perpendicular. El determinante es el vo- 
lumen de una caja. Luego, para una matriz positiva definida y su x"Ax, finalmente se 
obtiene una figura curva. Se trata de una elipse en dos dimensiones, y de un elipsoide en n 
dimensiones. 

La ecuación que debe considerarse es x"Ax = 1, Si A es la matriz identidad, esto 


se simplifica a x? +x2 +-++ + x? = 1, Ésta es la ecuación de la “esfera unitaria” en R”. 
Si A = 4], la esfera se vuelve más chica. La ecuación cambia a 4x2? + +++ +4x? = 1. 
En vez de pasar por (1, 0, ..., 0), lo hace por (1, 0,..., 0). El centro está en el origen, 


ya que si x satisface xP Ax = 1, también lo hace el vector opuesto —x. El paso importante es 
pasar de la matriz identidad a una matriz diagonal: 
4 
Elipsoide Para A = l , laecuación es xP Ax =4xi +x2 + Lx? =1. 


— 


9 

Debido a que los elementos son desiguales (¡y positivos!), la esfera cambia a un elipsoide. 

Una solución es x = dá, O, 0) alo largo del primer eje. Otra es x = (0, 1, 0). El eje ma- 
yor tiene el punto más alejado x = (0, O, 3). Se parece a una pelota de fútbol americano o 
rugby, aunque no exactamente; éstas están más próximas a xf +x32 +3x3 = 1. Los dos 
coeficientes iguales las hacen circulares en el plano x¡-x»,, ¡y más fáciles de lanzar! 

A continuación se presenta el paso final, para permitir elementos diferentes de cero le- 
jos de la diagonal de A. 


4 a ' 
q la 5| y xAx = Su? + 8uv + 5u? = 1. Esta elipse está centrada en u = v = 0, 


aunque los ejes no son tan claros. Los 4s fuera de la diagonal dejan positiva definida a la 
matriz, aunque hacen rotar la elipse, ya que sus ejes dejan de estar alineados con los ejes 
de coordenadas (véase la figura 6.2). Se demostrará que los ejes de las elipses apuntan ha- 
cia los vectores característicos de A. Debido a que 4 = A*, estos vectores característicos 
y los ejes son ortogonales. El eje mayor de la elipse corresponde al valor característico más 
pequeño de A. 





Dii7z350 
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75) 
Y2* 1/2 
u 


Figura 6.2 La elipse "Ax = 5u* + 8uv + 5u? = 1 y sus ejes principales. 


Para localizar la elipse se calculan A; = 1 y A, = 9. Los vectores característicos uni- 
tarios son (1, — DIJO A 12 . Estos son ángulos de 459 con los ejes u4-v, y están 
alineados con los ejes de la elipse. La forma para ver correctamente a la elipse es volver a 
escribir x"Ax = 1: 


2 2 
Nuevos cuadrados 5u? + 8uv + y? = (5 - 5) +9 (5 + 7) =1l, (4 
Y -— Y v2 Si 


=1 yA =D están fuera de los cuadrados. Los vectores característicos están dentro. Es- 
to es diferente para completar el cuadrado a 5 (u + uy + 2¿v?, con los pivotes fuera, 


El primer cuadrado es igual a 1 en (1/42, —1/v/2) al final del eje mayor. El eje menor 
es un tercio más corto, ya que para cancelar el 9 se requiere (1). 


Cualquier elipsoide x"Ax = 1 puede simplificarse de la misma manera. El paso clave 
es diagonalizar A = QA OQ? . La figura se enderezó al hacer girar los ejes. Algebraicamen- 
te, el cambio a y = QTx produce una suma de cuadrados: 


x= (xFQ)A(Q7x) =yY Ay = A yi + coo An = 1. (5) 


El eje mayor tiene y, = 1/ yA alo largo del vector característico con el menor valor ca- 
racterístico. 

Los otros ejes están en dirección de los otros vectores característicos. Sus longitudes 
son 1/Y/A2, ..., 1/V/An. Observe que los As deben ser positivos —la matriz debe ser posi- 
tiva definida—- O estas raíces cuadradas están en problemas. Una ecuación indefinida 
y? — 9y2? = 1 describe una hipérbola y no una elipse. Una hipérbola es una sección trans- . 
versal que pasa por una silla, y una elipse es una sección transversal que pasa por un tazón. 

El cambio de x a y = Q*x hace girar los ejes del espacio para coincidir con los ejes 
del elipsoide. En las variables y puede verse que se trata de un elipsoide, ya que la ecua- 
ción se vuelve manipulable: 





A 5% dE Se E Ey + Pao = 13 M 
Esta os a penis Sus ejes tienen ocios Í IVA E SA DA ca | 


0 es 7 at -¿ 
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Ejemplo 4 


Ejemplo 5 


La ley de la inercia 


Para eliminación y valores característicos, las matrices se vuelven más sencillas mediante 
operaciones elementales. La cuestión esencial es saber cuáles propiedades de una matriz 
permanecen sin cambio. Cuando un múltiplo de un renglón se resta de otro renglón, el es- 
pacio renglón, el espacio nulo, el rango y el determinante —todos-— permanecen igual. Para 
valores característicos, la operación básica fue una transformación de semejanza Á —> 
STIAS (o A —> MT1AM). Los valores característicos permanecen sin cambio (así como la 
forma de Jordan). Ahora se pregunta lo mismo para matrices simétricas: ¿cuáles son las 
operaciones elementales y sus invariantes para x* Ax? 

La operación básica sobre una forma cuadrática es cambiar variables. Un nuevo vec- 
tor y está relacionado con x por medio de alguna matriz no singular, x = Cy. La forma cua- 
drática se convierte en y"CTACy. Esto muestra la operación fundamental sobre A: 


Transformación de congruencia A >CYAC para alguna C no singular. (6) 


La simetría de A se preserva, ya que CAC permanece simétrica. La pregunta verdadera es 
¿qué otras propiedades comparten A y C*AC? La respuesta la proporciona la ley de la iner- 
cia de abla 





> racterísticos negativos, y valores característicos cero o que A: 


Los os de los valores característicos Ms: no los valores característicos mismos) se 


preservan con una transformación de congruencia. En la demostración, se supondrá que A: 


es no singular. Así, CTAC también es no singular, y no hay valores característicos de que 
preocuparse. (En caso contrario, es posible trabajar con la no singular A + €l y A— €l, y 
ai final hacer € —> 0.) 


Demostración Tomaremos prestado un truco de topología. Suponga que C está relacio- 
nada con una matriz ortogonal Q, por medio de una cadena continua de matrices no sin- 
gulares C(£). Ent=0yt= 1, C(O) =C y C() = 0. Así, los valores característicos de 
C()YAC(S cambian gradualmente, cuando 1 va de O a 1, de los valores característicos 
de CTAC alos valores característicos de OTAO. Debido a que C(£) nunca es singular, nin- 
guno de estos valores característicos puede tocar a cero (¡por no decir cruzarlo!) En con- 
secuencia, el número de valores característicos a la derecha de cero, y el número a la 
izquierda, es el mismo para CTAC que para OTAO. Y A tiene exactamente los mismos va- 
lores característicos que la matriz semejante O”14Q0 = OYAO. 

Una buena elección de Q consiste en aplicar el proceso de Gram-Schmidt a las colum- 
nas de C. Así, C = OR, y la cadena de matrices es C(2) = 1Q + (1 -DOR. La familia C(£) 
va lentamente a través del proceso de Gram-Schmidt, de OR a O. Es invertible porque Q 
es invertible y la diagonal del factor triangular ¿7 + (1 — OR es positiva. Así se termina la 
demostración, E 


Suponga que A = /, Entonces CYAC = C*C es positiva definida. Tanto 7 como CTC tienen 
n valores característicos positivos, lo cual confirma la ley de la inercia. 


SIA = | A E , entonces CYAC tiene un determinante negativo: 


det CTAC = (det CF det AMdet C) = —(det CY? <O0. 


Entonces C*AC debe tener un valor característico positivo y un valor característico nega- 
tivo, como A. 
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Ejemplo 6 
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Esta es la aplicación pu dd 





A AN 





a jee, 


E mentos cero. Pa A 
Se supondrá que A permite la factorización simétrica A = LDL" (sin intercambios de ren- 
glones). Por la ley de la inercia, A tiene el mismo número de valores característicos positi- 
vos que D. Sin embargo, los valores característicos de D son justo sus elementos diagonales 
(los pivotes). Así, el número de pivotes positivos coincide con el número de valores carac- 
terísticos positivos de A. 

Lo anterior es hermoso y práctico. Es hermoso porque conlleva (para matrices simétri- 
cas) dos partes de este libro que previamente estaban separadas: los pivotes y los valores 
característicos. También es práctico, ya que los pivotes pueden localizar a los valores ca- 
racterísticos: 


A tiene pivotes positivos A ; E - A a . > 
A -21 ti ivot ti Sl o 
ene un pivote negativo es o 


Gracias a nuestra prueba, los valores característicos de A son positivos. Pero se sabe que A mín 
es menor que 2, porque al restar 2 hizo que éste cayera bajo cero. En el siguiente paso se 
aborda A — [, para ver Amin < 1. (Esto se debe a que A — / tiene un pivote negativo). El inter- 
valo que contiene a A se divide a la mitad en cada paso al comprobar el signo de los pivotes. 

Este era casi el primer método práctico para calcular valores característicos. Era domi- 
nante alrededor de 1960, después de una mejora importante: hacer tridiagonal a Á primero. 
Luego, los pivotes se calculaban en 21 pasos, en vez de en in. La eliminación se vuelve rá- 
pida, y la búsqueda de valores característicos (al dividir en dos los intervalos) se vuelve sirm- 
ple. El favorito actual es el método OR que se presenta en el capítulo 7. 


El problema generalizado de valores característicos 


En sus problemas de valores característicos, la física, la ingeniería, y la estadística suelen 
ser suficientemente bondadosas para producir matrices simétricas. Sin embargo, algunas 
veces Ax = hx se sustituye por Ax = AMx. Hay dos matrices, en vez de una. 

Un ejemplo es el movimiento de dos masas distintas en una línea de resortes: 





m dv + 2vy w=0 
7 ed 2 E 
diw O mal dz? —] Pa 
2 — y +2w=0 
dt? 


Cuando las masas son iguales, m, = m, = 1, este era el sistema anterior 4” + Au = 0, Aho- 
ra es Mu” + Au = 0, que es una matriz “masa” M. El problema de valores característicos 
surge cuando se buscan soluciones exponenciales ex: 


Mu" + Au =0 se convierte en M(iw)e"x + Ae'x =0. (8) 


Al cancelar e'”*, y al escribir A por w”, este es un problema de valores característicos: 


O m> 


— 0 
Problema generalizado Ax = 1Mx E x=A y | x. (2) 


O 
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Existe una solución cuando A — AM es singular. La elección especial M = / devuelve la ex- 
presión de costumbre det (4 — Af) = 0. det (A —1M) se trabajará con m, = 1 y m, = 2: 


3 +43 
E 


Para el vector característico xy = (43 — 1, 1), las dos masas oscilan juntas, aunque la 
primera sólo se mueve y/3 — 1 = 0.73 En el modo más rápido, las componentes de 
x» = (1+ 4/3 — 1) tienen signos opuestos y las masas se mueven en direcciones opuestas. 
Esta vez la masa más pequeña avanza mucho más. 

La teoría subyacente es más fácil de explicar si M se separa en RR. (Se supone que M 
es positiva definida). Luego, la sustitución y = Rx cambia 





A NT a : e 
det | Si ¿Tap 22 61+3=0 proporciona A 


Ax =1Mx =AR'TRx hacia ARTy =AR y. 


Al escribir C por R”?, y multiplicar por (R7)7! = CT, lo anterior se convierte en un pro- 
blema de valores característicos estándar para la matriz simétrica simple CTAC: 


Problema equivalente CYtACy =1y. (10) 


Los valores característicos A, son los mismos que para la Ax = AMx original, y los vecto- 
res característicos están relacionados por y; = Rx;. Las propiedades de CYAC conducen di- 
rectamente a las propiedades de Ax = AMx, cunda 40 y M es positiva definida: 


1. Los valores característicos para Ax = AMx son reales, porque CTAC es simétrica. 

2. Por la ley de la inercia, los As tienen el mismo signo que los valores característicos 
de A. 

3. CAC tiene vectores característicos ortogonales y; Así, los vectores característicos de 
Ax = 1AMx tienen 


“M-ortogonalidad” xi Mxj =x R Rx, = y y; =0. (1D 


A y M se diagonalizan simultáneamente. Si S tiene los x, en sus columnas, entonces 
STAS =A y STMS = /. Esta es una transformación de congruencia, con SY en la i Izquier- 
da, y no una transformación de semejanza con S”?, Es fácil resumir la cuestión impor- 
tante: En tanto M es positiva definida, el problema generalizado de valores característicos 
Ax = AMx se comporta exactamente como Ax = Ax. 


dl Conjunto de problemas 6.2 


1. ¿Para qué intervalo de números a y b ocurre que las matrices A y B son positiva defi- 
nida? 


(a. 
ll 
N NA 


2 124 
ota B= 12 b $8 
Zo a 4 8 7 
2.  Decida sí las siguientes matrices son positiva definida o no: 


2 


a A a | INS MEE 
A=|_l a e ENE: - 0 Meca! pe LR E Ol 
e Z lb 1 Ze CS US 





10. 


11. 


12. 


13. 


14. 


15, 
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Construya una matriz indefinida cuyos elementos más grandes estén en la diagonal 
principal: 


DTD =D 
A=| b 1  b| conlb|< 1 puede tener det A < 0. 
e 1 


Demuestre a partir de los valores característicos que si Á es positiva definida, enton- 
ces también lo son 4? y A7?. 


SIA y B son positiva definida, entonces A + B es positiva definida. Los pivotes y los 
valores característicos no son convenientes para A + B. Es mucho mejor intentar 
xXHA + B)x >0. 

A partir de los pivotes, los valores característicos y los vectores característicos de 


A E ¿| , escriba A como RYR en tres formas: 


(ESDIJIDES, ON (AO. y COVNOTOSAOOD: 


SiA=0QA0Q', es positiva definida simétrica, entonces R = OQ /AOQ” es su raíz 
cuadrada positiva definida simétrica. ¿Por qué los valores característicos de R son po- 
sitivos? Calcule R, y compruebe que R? = A para 


1010 6 1006 
a=| 6 4 y a= | > 
Si A, es positiva definida simétrica y C es no singular, demuestre que B = CAC tam- 
bién es positiva definida simétrica. 


Si A = RYR, demuestre la desigualdad de Schwarz generalizada |x* Ay]? < (xP Ax) 
(y Ay). 

La elipse u* + 4u* = 1 corresponde a Á = Bi A . Escriba los valores característicos 
y los vectores característicos, y trace la elipse. 

Reduzca la ecuación 3u? — 24/2uv + 2v? = 1. a una suma de cuadrados encontran- 
do los valores característicos de la A correspondiente, y trace la elipse. 

En tres dimensiones, A y? + A2y2 + Asy2 = ] representa un elipsoide cuando 
todos los A; > O. Describa todas las distintas clases de superficies que aparecen en el ca- 
so positiva semidefinida cuando uno o más de los valores característicos es (son) cero. 


Escriba las cinco condiciones para que una matriz de 3 por 3 sea negativa definida 
(—A es positiva definida) con atención especial a la condición TI: ¿Cómo está relacio- 
nado det (—A) con det 4? 


Decida si las siguientes matrices son positivas definidas, negativas definidas, semide- 
finidas, O indefinidas: 


A=|2 5 4], B= y, C=-—B, D=A”. 
AO A 
O + E 


th 


¿Existe una solución real para —x? — 5y? — 92? — 4xy — 6xz — 8yz = 1? 


Suponga que A es positiva definida simétrica y que O es una matriz ortogonal. ¿Falso 
o verdadero? 
a) OYAO es una matriz diagonal. 


E) 
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16. 


Ef 


13. 


19. 


20. 


21. 


22. 


2d 


24. 


23. 


b) OTAO es positiva definida simétrica. 
c) O*AO tiene los mismos valores característicos que A. 
d) e”? es positiva definida simétrica. 


Si A es positiva definida y se incrementa a, 1, a partir de cofactores demuestre que el 
determinante se ha incrementado. Demuestre con un ejemplo que lo anterior puede fa- 
llar si A es indefinida. 


A partir de A = RYR, demuestre para matrices positivas definidas que detA < 
0110422 *** Gnn. (La longitud al cuadrado de la columna ¡de R es a, Use determinan- 


te = volumen.) 


(Prueba de M de estabilidad de Lyapunov) Suponga que AM + MPA = —IconA po- 
sitiva definida. Si Mx = Ax, demuestre que Re 4 < 0, (Sugerencia: Multiplique la pri- 
mera ecuación por x* y x.) 


¿Cuáles matrices simétricas A de 3 por 3 producen las siguientes funciones f = x1Ax? 
¿Por qué la primera matriz es positiva definida pero la segunda no? 


a f= 2, +x al MO — x2X3). 
DY FPELUEPIAA A 


Calcule los tres determinantes superiores izquierdos para establecer la condición de po- 
sitiva definida. Compruebe que sus razones proporcionan los pivotes segundo y tercero. 


A 
ASS Sl 
IE PA + 


Una matriz positiva definida no puede tener un cero (o incluso peor: un número nega- 
tivo) en su diagonal. Demuestre que esta matriz no cumple x"Ax > 0: 


4 1 1 X1 
[x1 xa x3] 1 0 2]| |x2l| noes positiva cuando (x1,x2,Xx3) =( , , ) 
1 OS 3 


Un elemento diagonal a, de una matriz simétrica no puede ser menor que todos los As. 
Si lo fuese, entonces Á — aj, tendría valores característicos y posiblemente se- 
ría positiva definida. Sin embargo, A — a, Í tiene un en la diagonal principal. 








Proporcione una razón rápida de por qué las siguientes afirmaciones son verdaderas: 


a) Toda matriz positiva definida es invertible. 

b) La única matriz proyección positiva definida es P = 1, 

c) Una matriz diagonal con elementos diagonales positivos es positiva definida. 

d) ¡Una matriz simétrica con un determinante positivo podría no ser positiva definida! 


¿Para cuáles 5 y 1 se cumple que A y B tienen a todos los A > O (y por tanto son posi- 
tivas definidas)? 
s 4 —4 3 0 
A=|j4 5 -4 y B=13 tr 4 
4 -4 $ 0-7 


Tal vez usted ya haya visto la ecuación de una elipse como ( 8 * (py le ¿Cuáles 


son a y b cuando la ecuación se escribe como 1/1? + 12 y? = 1? La elipse 9x1? + 
16y” = 1 tiene semiejes cuyas longitudes son a = yb= 
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26. Trace la elipse inclinada 1? + xy + y? = 1 y encuentre las sernilongitudes de sus 
ejes, a partir de los valores característicos de la A correspondiente. 


27 


Con pivotes positivos en D, la factorización A = LDL* se convierte en L/DV/DL”. 


(Las raíces cuadradas de los pivotes proporcionan D = VDD. Así, C =LVD 
conduce a la factorización de Cholesky A = CC*, que es “simetrizada LU”: 


A partir de C | = h 3 encuentre A. A partir de A = S hd encuentre C. 


En la factorización de Cholesky A = CC*, con € = LD, las raíces cuadradas de los 
pivotes están en la diagonal de C. Encuentre C (triangular inferior) para 


28 


* 


0000 E 
A=|0 1 2| y A=|1 2 2 
0 2 8 ¡ES 


29. La factorización simétrica A = LDL? significa que x"Ax =x"LDLTx: 


A A PA [le 


El miembro izquierdo es ax? + 2bxy + cy?. El miembro derecho es a(x+2y)*+ 
yA 
¡El segundo pivote completa el cuadrado! Pruebe con a = 2,b=4,c = 10. 


ñ E cos  —sen9 e cosó  sen9 
30. Sin multiplicar Á = pos 220) E 3] e se encuentre: 





aj) El determinante de A. 

b) Los valores característicos de A. 

c) Los vectores característicos de A. 

d) Una razón de por qué Á es positiva definida simétrica. 


31. Para las matrices semidefinidas 


o a 5 E | 
A= ¡-1 "Sii (raaso2) Y BRL E 1]|(ang01) 
o Z LE 


Escriba x"Ax como una suna úl dos cuadrados y x*Bx como un cuadrado. 


32. Aplique tres pruebas cualesquiera para probar cada una de las siguientes matrices 


iu AS CRES 
A=j j1 1 1 y B=|1 1 1], 
1 AS CA a A 
y decidir si son positivas definidas, positivas semidefinidas, o indefinidas. 


33. Para C = ñ eN y A = E y confirme que CYAC tiene valores característi- 


cos de los mismos signos que A. Construya una cadena de matrices no singulares C(£) 
que relacione a C con una Q ortogonal. ¿Por qué es imposible construir una cadena no 
singular que relacione a C con la matriz identidad”? 


34. Si todos los pivotes de una matriz son mayores que 1, ¿es cierto que todos los valores 
característicos son mayores que 1? Pruebe lo anterior con las matrices tridiagonales 
e A 
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35 


36. 


37. 


383. 


39, 
40. 


41. 


42. 


43. 


Use los pivotes de A — 3 1 para decidir si A tiene un valor característico menor que 


1 E, 0 
A=-I=/|3 9 Y 

E 0 70 
Una demostración algebraica de la ley de la inercia empieza con los vectores caracte- 
rísticos ortonormales xy, . . . , Xx, de A correspondientes a los valores característicos 
A¿ > 0, y los vectores característicos ortonormales yy, ..., yz de CYAC correspondien- 
tes a los valores característicos 4, < O. 
a) Para demostrar que los p + q vectores x;,..., Xp, Cy1,..., Cyg Son independien- 


tes, suponga que alguna combinación proporciona cero: 


ap Fax) == CY +" eb Cy, (2, digamos). 


Demuestre que z7Az = 1¡ai+::: + 1,4% 0 Y ZAR DE + Hbo < 0. 


b) Deduzca que las as y las bs son cero (demostrando independencia lineal). Con ba- 
se en lo anterior, deduzca que p +q=n. 

c) Con el mismo razonamiento para los n — p As negativos y los n — q us positivos se 
obtiene n — p + n-—q < n. (Nuevamente se supone que no hay valores caracterís- 
ticos diferentes de cero, que se manejan por separado). Demuestre que p + q = n, 
de modo que el número p de As positivos es igual al número r — q de s positivos; 
lo cual es la ley de la inercia, 


Si C es no singular, demuestre que A y CYAC tienen el mismo rango. Así, tienen el 
mismo número de valores característicos cero. 


Por experimentación, encuentre el número de valores característicos positivos, nega- 
tivos, y cero de 
IB 
Á= T 
B" 0 


cuando el bloque B (de orden 2n) es no singular. 
¿A y CYAC siempre satisfacen la ley de la inercia cuando C no es cuadrada? 


En la ecuación (9) con m, = 1 y m, = 2, compruebe que los modos normales son M 
ortogonales: xMxz =0. 


Encuentre los valores característicos y los vectores característicos de Ax = AMx: 


023 cia A [4 1 
3 6 A de 
Si las matrices simétricas A y M son indefinidas, Ax = AMx podría no tener valores 
característicos reales. Construya un ejemplo de 2 por 2. 


Un grupo de matrices singulares incluye A B y A”? si incluye a A y B. “Los produc- 
tos e inversas permanecen en el grupo”. ¿Cuáles de los siguientes conjuntos son gru- 
pos? Matrices positivas definidas simétricas A, matrices ortogonales O, todas las 
exponenciales e'* de una matriz fija A, las matrices P con valores característicos po- 
sitivos, matrices D con determinante 1. Invente un grupo que sólo contenga matrices 
positivas definidas. 


19 jr. 
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6.3 DESCOMPOSICIÓN DEL VALOR SINGULAR 


Para el final del curso básico se ha dejado una gran factorización matricial. U NV? se 
vincula con LU de la eliminación y con OR de la ortogonalización (Gauss y proceso de 
Gram-Schmidt). No se le ha asignado ninguna denominación o nombre: A = U EV? se co- 
noce como “DVS” o descomposición del valor singular. Así como “SVD” por sus siglas 
en inglés. Se quiere describirlo, demostrarlo, y analizar sus aplicaciones, que son muchas 
y cada vez más numerosas. 

La DVS está estrechamente relacionada con la factorización valores característicos- 
vectores característicos QAO* de una matriz positiva definida. Los valores característicos 
están en la diagonal de la matriz A. La matriz vector característico O es ortogonal (O0*O = 
D) porque es posible escoger que los vectores característicos de una matriz simétrica sean 
Ortonormales. Esto no es cierto para la mayor parte de las matrices, y para las matrices rec- 
tangulares es ridículo (porque los valores característicos están indefinidos). Sin embargo, 
ahora se permite que O a la izquierda y O” a la derecha sean dos matrices ortogonales cua- 
lesquiera U y V”, no necesariamente traspuestas entre sí. Así, toda matriz puede separarse 
en A = UEV?, 

¡La matriz diagonal (pero rectangular) * tiene valores característicos de ATA, no de 
A! Estos elementos positivos (que también se denominan sigma) son 2;,..., E, Son los 
valores singulares de A, y ocupan los r primeros sitios sobre la diagonal principal de 2, 
cuando el rango de A es r. El resto de 2 es cero. 

Con matrices E nsniaies casi siempre la clave es considerar AYA y AA, 








- Descomposición. del valor dea ular: Cualquier matriz 
- ZArse como O TAR ue | 


- de -U2Y" = 





-(ortogonal)(dlagonal (ortogonal. 


_Tes. ON en la diagonal de E (mp por UNS son. jes raíces. cuadradas de los. valores 
- Característicos diferentes de cero tanto. de BAT como de AA, Ñ 


Observación 1 Para matrices positivas definidas, E es A y U EV? es idéntica a oAO0”. 
Para otras matrices simétricas, cualesquiera valores característicos negativos en Á se vuel- 
ven positivos en 2. Para matrices complejas, 2 permanece real pero U y V se convierten 
en unitarias (la versión compleja de las matrices ortogonales). Se toman conjugados com- 
plejos en UFU = Iy VIV = 1 yA = U EvV?. 


Observación 2 U y V constituyen bases ortonormales de todos los cuatro subespacios 
fundamentales: 


Las primeras r columnas de U': espacio columna de A 

Las últimas m — r columnas de U: espacio nulo izquierdo de A 
Las primeras r columnas de V: espacio renglón de A 

Las últimas n — r columnas de V: espacio nulo de A 


Observación 3 La DVS escoge estas bases de una manera extremadamente especial. Son 
más que simplemente ortonormales. Cuando A multiplica a una columna v, de V, produce 
E, veces una columna de U. Este hecho proviene directamente de AV = UY, considerada 
una columna a la vez. 


Observación 4 Los vectores característicos de AA* y ATA deben ir en las columnas de U 
y V: 


EN nr 
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Ejemplo 1 


Ejemplo 2 


AAT=(UEVIVI TU”) =UEYXTU" similar y A YA=VET EV? (1 
U debe ser la matriz vector característico para AA*. La matriz valor característico que es- 
tá en medio es E E*, que es de m por m con a?,...,o ? en la diagonal. 
Con baseen ATA = Vx TEV?, la matriz V debe ser la matriz vector característico 
para ATA. La matriz diagonal E* 2 tiene los mismos g?,...,o ?, pero es de n por ñ. 


Observación 5  Estaes la razón por la que Av; = o¡u;¡. Se empieza con ATAv; = 0% Av;: 

Multiplicar por A AA* Av; =0; Av); (2) 
¡Lo anterior indica que Av, es un vector característico de AA*! Simplemente se movieron 
los paréntesis a (AABXAD). La longitud de este vector característico Av, es 2,, ya que 


$ AT e : oz 
v A “Av; =0;v;v; proporciona l Av,” = 07. 
De modo que el vector característico unitario es Av;/a; = u4;. En otras palabras, AV = 


U2. 


Esta A sólo tiene una columna: rango 7 = 1. Entonces, 2 sólo tiene 2, = 3: 


51 A a da 
pYS a=[2=1 3-3 5[f0) Uso Esa Via 
y 2 c=i 
2 E Me E 


ATA es de 1 por 1, mientras AA? es de 3 por 3. Ambas tienen valor característico 9 (cuya 
raíz cuadrada es 3 en 2). Los dos valores característicos cero de A4* dejan algo de liber- 
tad para los vectores característicos en las colunmas 2 y 3 de U. Esta matriz debe mante- 
nerse ortogonal. 

Ahora el rango de Aes 2, y AA* = e E 


ON pl y 3 00750 1 -2 11/46 
00 E 1 VA e o E A A 
1 SU A ES 


Observe a 43 y /1. Las columnas de U son vectores singulares ¡zquierdos (vectores ca- 
racterísticos unitarios de 44). Las columnas de V son vectores singulares derechos (vec- 
tores característicos unitarios de ATA). 


[conA=3y1: 


Aplicaciones de la DVS 


Se presentan algunas aplicaciones importantes, luego de recalcar una cuestión. La DVS es 
terrorífica para cálculos numéricamente estables, ya que U y V son matrices ortogonales. 
Nunca cambian la longitud de un vector. Debido a que ||Ux|? = xTUTUx = I|x/1?, la 
multiplicación por U no puede destruir el escalamiento. 

Por supuesto, 2 puede multiplicar por un gran * o bien (lo que es más común) divi- 
dir entre un 2 pequeño, y saturar la computadora. Sin embargo, E es la mejor posible. 
Revela exactamente qué es grande y qué es pequeño. La razón E máx / Emin es el número 
de condición de una matriz invertible de n por n. La disponibilidad de esta información 
es otra razón que explica la conocida popularidad de la DVS. En la segunda aplicación se 
volverá a esto. 


1. Procesamiento de imágenes Suponga que un satélite toma una fotografía, y quiere 
enviarla a la Tierra. La fotografía puede contener 1000 por 1000 “pixeles”: un millón de 
cuadros pequeños, cada uno con un color definido. Es posible codificar los colores y trans- 
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mitir 1 080000 de' números. Es mejor, encontrar: Ja HONRA Ésencial dentro de la ma- 
triz de 1000 por 1000; ' y enviar sólo ad 
Suponga que se conoce la DVS. La clave está en los valores singulares (en 2). Típi- 
camente, algunos os son significantes y otros son extremadamente pequeños. Si se preser- 
van 20 y se desechan 980, entonces sólo se envían las 20 columnas correspondientes de U 
y V. Las otras 980 columnas se multiplican por UE V* por los os pequeños que se han 18- 
norado. La multiplicación de matrices puede hacerse como columnas por renglones: 


Á = Uy == U¡ 0] UL + 420202 qn + uo U, (3) 


Cualquier matriz es la suma de r matrices de rango 1. Si sólo se preservan 20 términos, se 
envían 20 veces 2000 números, en vez de un millón (compresión de 23 a 1), 

Las fotografías son verdaderamente sorprendentes, a medida que se incluyen más y 
más valores. Al principio no se ve nada y repentinamente se reconoce todo. El costo está 
en el cálculo de la DVS; ésta se ha vuelto mucho más eficaz, aunque es costosa para una 
matriz grande. 


2. El rango efectivo El rango de una matriz es el número de renglones independien- 
tes, y el número de columnas independientes. ¡Esto puede ser difícil de decidir en cálcu- 
los! En aritmética exacta, el conteo de los pivotes es correcto. La aritmética real puede ser 
engañosa, aunque eliminar los pivotes pequeños no es la respuesta. Considere lo siguien- 


te: 
e 1 € 1 
0 0 y E a 


El rango de la primera es 1, aunque el error por redondeo probablemente produzca un se- 
gundo pivote. Ambos pivotes son pequeños, así que ¿cuántos se ignoran? La segunda tie- 
ne un pivote pequeño, pero no es posible pretender que este renglón es insigmficante. La 
tercera tiene dos pivotes y su rango es 2, aunque su “rango efectivo” debe ser 1. 

A continuación se procede a una medición más estable del rango. El primer paso es 
utilizar ATA o AA?, que son simétricas pero tienen el mismo rango que A. Sus valores ca- 
racterísticos —los valores singulares al cuadrado— no son engañosos. Con base en la preci- 
sión de los datos, se decide en una tolerancia como 107 * y se cuentan los valores singulares 
arriba de ésta: este es el rango efectivo. Los ejemplos anteriores tienen rango efectivo 1 
(cuando € es muy pequeño). 


E e € 
es 
e es pequeño | 1 5 


3. Descomposición polar Todo número complejo z es un número positivo r multipli- 
cado por e* en la circunferencia unitaria: z = re”, Esto expresa a z en “coordenadas pola- 
res”. Si se considera que z es una matriz de 1 por 1, r corresponde a una matriz positiva 
definida y e? corresponde a una matriz ortogonal. Más exactamente, debido a que e” es 
complejo y satisface e” Pe? = 1, forma una matriz unitaria de 1 por 1: UYU = 1. Se toma 
el conjugado complejo, así como la traspuesta, de U*. 

La DVS extiende esta “factorización polar” a matrices de cualquier tamaño: 







Toda n mátriz cuadrada real puede factorizarse enA + =-QS, donde O! es ortogonal y S | 
ES 'semidefinida pasiapo simétrica. si As es s invertible entonces $5 es ón definida. 


Para E o: anterior adas amd se inserta a Vy= mn en Sato de la DVS: 
A=UYEV! =(UV"XVEV?) Sa 


E EN 
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Ejemplo 3 


Ejemplo 4 


El factor S = VEV? es simétrica y semidefinida (porque Y lo es). El factor Q = UV? es 
una matriz ortogonal (porque OQTQ = VUTUV? = J ). En el caso complejo, S se convier- 
te en hermitiana en vez de simétrica y O se vuelve unitaria en vez de ortogonal. En el ca- 
so invertible, 2 es definida, así como $. 


Descomposición polar: 
os - RI 
Descomposición polar inversa: 
a=se 1 Al=a][i o). 


Los ejercicios muestran cómo, en orden inverso, S cambia pero O permanece igual. Tanto 
S como S' son positivas definidas simétricas porque A es invertible. 


Aplicación de A = QS: Una utilización fundamental de la descomposición polar se en- 
cuentra en mecánica del continuo (y recientemente en robótica). En cualquier deformación, 
es importante separar el alargamiento de la rotación, que es exactamente lo que logra QS. 
La matriz ortogonal Q es una rotación, y quizá una reflexión. El material no experimenta 
deformación. La matriz simétrica S tiene valores característicos X;,..., *,, que son los 
factores de alargamiento (o de compresión). La diagonalización que despliegan estos valo- 
res característicos constituye la elección natural de los ejes, denominados ejes principales: 
así como con las elipses en la sección 6.2. Es S la que requiere trabajar con el material, y 
almacena energía elástica, 

Se observa que $” es ATA, que es positiva definida simétrica cuando A es invertible. $ 
es la raíz cuadrada positiva definida simétrica de ATA, y O es AS”?, De hecho, A puede ser 
rectangular, en tanto ATA sea positiva definida. (Esta es la condición que se ha cumplido, 
que A tenga columnas independientes.) En el orden inverso A = S'Q, la matriz S' es la raíz 
cuadrada positiva definida simétrica de AA”, 


4. Mínimos cuadrados Para un sistema rectangular Ax = b, la solución por mínimos 
cuadrados proviene de la ecuación normal ATAX = ATb.SiA tiene columnas dependien- 
tes, entonces ATA no es invertible y X no está determinado. Cualquier vector en el espa- 
cio nulo puede sumarse a x. Ahora es posible completar el capítulo 3, eligiendo un “mejor” 
(más corto) x para toda Ax = b. 

Áx = b tiene dos posibles dificultades: renglones dependientes o columnas dependien- 
ies. Con renglones dependientes, Ax = b puede no tener solución. Esto ocurre cuando bh es- 
tá fuera del espacio columna de A. En vez de resolver Ax = b, se resuelve ATAX =ATb, 
Pero si A tiene columnas dependientes, este X no es único. Es necesario escoger una solu- 
ción particular de ATAX = ATb, y se elige la más corta. 





Esa solución de longitud mínima se denomina x*. Es nuestra opción preferida como 
la mejor solución de Ax = b (que no tenía solución), y también de ATAX = ATD (que te- 
nía demasiadas). Empezamos con un ejemplo diagonal. 


| 

| 
| 
| 

| 

| 

| 
| 
4 
: 
E | 





Ejemplo 5 
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A es diagonal, con renglones dependientes y columnas dependientes: 


o 0 0.0 a b, 
AX=p es O 0 0.0 = = | ba 
0 O COn O 0 

Xa4 


Todas las columnas terminan con cero. En el espacio columna, el vector más próximo a 
b = (b,, b,, b3)es p = (b,, ba, 0). Lo mejor que puede hacerse con Ax = b es resolver las 
dos primeras ecuaciones, ya que la tercera ecuación es 0 = b,. Este error no puede redu- 
cirse, pero los errores en las dos primeras ecuaciones es cero. Así, 


Xi =bif0, y X= b2/0». 


Ahora se enfrenta la segunda dificultad, Con la finalidad de hacer a x lo más peque- 
ño posible, se escoge que los totalmente arbitrarios X3 y Y, sean cero. La solución de lon- 
gitud mínima es x*: 


b,/0 1/0; 0 0 b; 
A* es seudoinversa $ Wbofol o. 100. fo 01 1b7|. 5 
xt =Atbesmáscorta * "| 0 | 10 O  Ollb; 3) 
0 0 0 0 


Con esta ecuación se encuentra x*, y también se despliega la matriz que produce x* 
a partir de b. Esta matriz es la seudoinversa A* de la A diagonal. Con base en este ejem- 
plo, E * y x* se conocen para cualquier matriz diagonal 3: 


d1 1/0 bi/a; 


Y = E n* = E stb=| : | 
O, 1/0, b,10, 


La matriz Y es de m por n, con r elementos diferentes de cero en X;. Su seudoinversa E? 
es n por m con elementos r diferentes de cero en 1 7 2; Todos los espacios en blanco son 
ceros. Observe que (3 *)* es de nuevo YX. Esto es como (47*)7* = A, pero aquí A no es 
invertible. 

A continuación se encuentra x* en el caso general. Se afirma que la solución más 
corta x*, siempre está en el espacio renglón de A. Recuerde que cualquier vector X pue- 
de separarse en una componente espacio renglón x, y una componente espacio nulo 
XxX =xX, Xp. A continuación se presentan tres cuestiones importantes sobre esa separa- 
ción: 


1. La componente espacio renglón también resuelve ATAX, = Ab, porque Ax, = O. 
2. Las componentes son ortogonales, y cumplen el teorema de Pitágoras: 


11? = lx? + lx,.11?, de modo que X es más corto cuando x, = 0. 


3. Todas las soluciones de ATAX = AT» tienen el mismo x,. Ese vector es x*. 


El teorema fundamental del álgebra lineal se mostró en la figura 3.4. Todo p en el espacio 
columna proviene de uno y sólo un vector x, en el espacio renglón. Todo lo que se está ha- 
ciendo es escoger ese vector x* = x,, como la mejor solución de Ax = b. 

La seudoinversa en la figura 6.3 empieza con b y regresa a x”. Invierte a A donde A 
es invertible: entre el espacio renglón y el espacio columna. La seudoinversa elimina al es- 
pacio nulo izquierdo al enviarlo a cero, y elimina el espacio nulo escogiendo a x, como e 
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Espacio 
columna 
p= Axt 





Espacio renglón 










Espacio 
nulo 





Espacio nulo 
de A* 


Figura 6.3 La seudoinversa A* invierte A donde puede sobre el espacio columna. 


Aún no se demuestra que existe una matriz A” que siempre proporciona x*, pero la 
hay. Esta matriz es de mm por n, ya que lleva b y p en R” de regreso a x” en R”. Antes de 
encontrar en general a A* se considerará otro ejemplo. 

Ejemplo 6 — Ax=bes-x, + 2x2 + 2x3 = 18, con un plano completo de soluciones. 

Según nuestra teoría, la solución más corta debe estar en el espacio renglón de A = 
[—1 2 2]. El múltiplo de ese renglón que satisface la ecuación es x* = (—2, 4, 4). Hay so- 
luciones más largas como (—2, 5, 3), (—2, 7, 1), o (—6, 3, 3), pero todas tienen componen- 
tes diferentes de cero provenientes del espacio nulo. La matriz que produce x* a partir de 
b = [18] es la seudoinversa A”. Mientras A era de 1 por 3, esta A* es de 3 por 1: 


1 
-1 -2 
9 
At=[-1 2 2] =| 3] y at8sj=]| al (6) 
$ 4 


El espacio renglón de A es el espacio columna de A*. A continuación se proporciona una 
fórmula para A”: 





En el ejemplo 6 se tenía E = 3; la raíz cuadrada del valor característico de A4* = (9]. Aquí 
está de nuevo con E y E”: 


mio ra 
E 3 E 
4=[-1 2 2] =0xNvV*=[1][3 0 01 | 3 -3 $ 
e 
3 3 3 
os 
VEUT=]| 5 -4 ¿| ]0 =| ¿| =A?*. 
2 AS 0 2 > 
3 3 3 9 


La solución de longitud mínima por mínimos cuadrados es x? = ATb = VE*U*b. 
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Demostración la multiplicación por la matriz ortogonal U* deja sin cambio las longitudes: 
Ax —b]| = ¡UEV?x —bI| =|EV*x — U*b!. 


Se introduce la nueva incógnita y = Vx = V”!x, cuya longitud es la misma que x. Así, 
minimizar || Ax — bl] es lo mismo que minimizar || Y y — U*b||. Ahora X es diagonal y se 
conoce el mejor y*. Se trata de y? = 3*U*Tb, de modo que el mejor x* es Wy*: 


Solución más corta == VyY" == VE O Db=Ab. 
Vy* está en el espacio renglón, y AYAx* = ATb proviene de la DVS. ma 


Conjunto de problemas 6.3 
En los problemas 1 y 2 se calcula la DVS de una matriz singular cuadrada A. 


1. Calcule 4*A y sus valores característicos g?, O y sus vectores característicos unitarios 


Vi, Uz. 
1 4 
A = . 
2 8 
2. 4) Calcule AA? y sus valores característicos o?, O y sus vectores característicos unita- 
rÍOS 1£;, Ur. 


b) Escoja signos de modo que Av, = 2,444 y compruebe la DVS: 


Earle o yla le 


c) ¿Cuáles son los cuatro vectores que proporcionan bases ortonormales para C( A). 
N(A), CCAB), NAT)? 


En los problemas 3 a 5 se solicita la DVS de matrices de rango 2. 


3. Encuentre la DVS a partir de los vectores característicos v,, vz de ATA y Av, = ou; 


Matriz de Fibonacci A= P e : 


4. Use la parte DVS del demo eigshow de MATLAB (o Java en la página del curso 
web.mit.edu/18.06) para encontrar gráficamente los mismos vectores v, y Uz. 


3. Calcule AYA y AA, así como sus valores característicos y vectores característicos uni- 
tarios para 
ETE (2) CO 1 Y 
e o 1 | 


Multiplique las tres matrices U EV* para recuperar A. 
Los problemas 6 a 13 abordan las ideas subyacentes de la DVS. 


6. Suponga que 44;,...,U4, Y Uj,..., v, son bases ortonormales de R”. Construya la ma- 
triz A que transforma cada v, en u, para obtener Av, = U4y,..., AU, = Uno 

7. Construya la matriz con rango 1 que tiene 4v = 12u para y = 3(1, 1,1,D)yu= =(2, 
2, 1). Su único valor singular es 0, = 

8. Encuentre UXV? si A tiene columnas ortogonales w,.. . , W, de longitudes 0, ...., 
270 

9. Explique cómo UEV* expresa A como una suma de r matrices de rango 1 en la ecua- 
ción (3): Á = guy vu, OS + 0,4, U,. 
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10. 


11. 


12. 


13. 
14. 
15, 


16. 
17. 


18. 


19. 


20. 
21. 


22, 


23. 


Suponga que A es una matriz simétrica de 2 por 2 con vectores característicos unitarios 
us y us. Si sus valores característicos son A; = 3 y A2 = —2, ¿cuáles son U, E, y V*? 


Suponga que A es invertible (con o, > 07 > 0). Cambie A por una matriz lo más pe- 
queña posible para obtener una matriz singular Ay. Sugerencia: U y V no cambian: 


T 
Encuentre Aj, a partir de Aa=[u uo | Ñ A E ve]. 


a) Si A cambia a 44, ¿cuál es el cambio en la DVS? 
b) ¿Cuál es la DVS para A* y A7*? 


¿Por qué la DVS para A + ] no utiliza simplemente 2 + 7? 
Encuentre la DVS y la seudoinversa 0* de la matriz cero de m por n. 


Encuentre la DVS y la seudoinversa VE*U* de 


OSO al 
A=[1 1 1 1], B=|; O de y c=|; ol 


Si una matriz O de a por » tiene columnas ortonormales, ¿cuál es O*? 


Diagonalice ATA para encontrar su raíz cuadrada positiva definida S = VEY?2y?7 y su 
descomposición polar A = QS: 


E le , 
TOLDOS 


¿Cuál es la solución de longitud mínima por mínimos cuadrados x* = A*b de lo si- 
guiente? 


LO UE 0 
Ax=|1 O 0] [D| =]2], 
EJES E Ze 


Es posible calcular A*, o encontrar la solución general para ATAZ = ATb y escoger 
la solución que está en el espacio renglón de A. Este problema ajusta el mejor plano 
C+Dt+Ezab=0ytambiéenab=2ent=z=0(yb=2ent=z= 1). 


a) Si A tiene columnas independientes, su inversa izquierda (ATA) lAT es A?. 

b) Si A tiene renglones independientes, su inversa derecha AAA)? es A?, 

En ambos casos, compruebe que x? = A*b está en el espacio renglón, y que ATAx* 
= A?b, 


Separe A = U EV? en su descomposición polar inversa QS”. 


La expresión (AB)? = B*A*, ¿siempre es verdadera para seudoinversas? Creo que 
no. 


Si se eliminan los renglones cero de U se queda con A = £ U, donde las r columnas 
de £ generan el espacio columna de A y los r renglones de U generan el espacio ren- 
glón. Así, A” tiene la fórmula explícita UKU UB ULTLyAL?, 


¿Por qué A*b está en el espacio renglón con U? al frente? ¿Por qué ATAA*b = ATb, 
de modo que x* = A*b satisface la ecuación normal como debe hacerlo? 

Explique por qué AA* y AYA son matrices proyección (y por tanto simétricas). ¿So- 
bre qué subespacios fundamentales se proyectan? 
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6.4 PRINCIPIOS MINIMALES 


En esta sección nos escapamos por primera vez de las ecuaciones lineales. La incógnita x 
no se proporcionará como la solución de Ax = bo Ax = Ax. En vez de ello, el vector x se 
determinará por un principio mínimo. 

Es sorprendente la cantidad de leyes naturales que pueden expresarse como principios 
minimales. Justo el hecho de que los líquidos pesados se hunden hasta el fondo es una con- 
secuencia de minimización de su energía potencial. Y cuando una persona se sienta en un 
automóvil o se acuesta en una cama, los resortes se ajustan a sí mismos de modo que la 
energía se minimiza. Una pajilla en un vaso de agua se ve flexionada porque la luz llega al 
ojo lo más rápido posible. Ciertamente hay ejemplos más intelectuales: el principio funda- 
mental de la ingeniería estructural es la minimización de la energía total.” 

Es necesario mencionar de inmediato que estas “energías” no son otra cosa que fin- 
ciones cuadráticas positivas definidas. Y la derivada de una cuadrática es lineal. Volvemos 
a las conocidas ecuaciones lineales, cuando las primeras derivadas se igualaron a cero. El 
primer objetivo en esta sección es encontrar el principio mínimo equivalente a Ax = b, y 
la minimización equivalente a Ax = Ax. En dimensiones finitas se hará exactamente lo 
que la teoría de la optimización hace en un problema continuo, donde “primeras derivadas 
= 0” proporciona una ecuación diferencial. En todo problema, se tiene libertad de resolver 
la ecuación lineal o de minimizar la cuadrática. 

El primer paso es directo: se desea encontrar la “parábola” P(x) cuyo mínimo ocurre 
cuando Ax = b. Si A es justo un escalar, es fácil hacer lo anterior: 


l dP 
La gráfica de P(x) = ¿Ar — bx tiene pendiente cero cuando y Ax—b=0. 


Este punto x = A” *b es un mínimo si A es positiva. Así, la parábola P(x) se abre hacia arri- 
ba (véase la figura 6.4). En más dimensiones esta parábola se transforma en un tazón pa- 
rabólico (un paraboloide). Para asegurar un mínimo de P(x), no un máximo o un punto 
silla, ¡A debe ser positiva definida! 


om SIA Ae es s positiva « definida simétrica, entonces Pu) A 
- mínimo € en n.el | punto donde Ax = - sb. En ese punto, E Pr 


A 
ps 





Mínimo en 
x= ATÍb 





Figura 6.4 La gráfica de una cuadrática positiva P(x) es un tazón parabólico. 


“Estoy convencido de que los vegetales y los humanos también se desarrollan según principios minimales. Qui- 
zá la civilización está basada en una ley de acción mínima. Debe haber nuevas leyes (y principios minimales) por 
descubrir en las ciencias sociales y en las ciencias de la vida, 
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Ejemplo 1 


Ejemplo 2 


Demostración Suponga que Ax = b. Para cualquier vector y, se demostrará que P(y) 2 
PEE 


1 1 
PO) =P) = 5 Ay yb ¿1 Ax + b 
1 
_ ¿"Ay — y Ax + 75 Ax (iguale hb = Ax) 


1 
SO —x Ay —x). (1D 


Lo anterior no puede ser positiva definida porque A es positiva definida, y es cero sólo si 
y —x = 0. En todos los demás puntos, P(y) es más grande que P(x), de modo que el míni- 
mo ocurre en x. Mm 


Minimizar P(x) = x?— x1x2 + x5 — bix1 — b2x2. El método de costumbre, por cálculo, 
es igualar a cero las derivadas parciales. Así se obtiene Ax = b: 
oP/9x; = 2x1 — x2 — bj = 0 : fi o | XA bi 
A A E E A E a E 
El álgebra lineal reconoce esta P(x) como 3x1 Ax — x"b, y sabe de inmediato que Ax = b 
proporciona el mínimo. Se sustituye x = A7*b en P(x): 


1 1 
Valor mínimo Porta = ¿(ATOYACA”D) =(ATD'b = PAT b, (3) 


En aplicaciones, Y Ax es la energía interna y -x*b es el trabajo externo. El sistema 
automáticamente se vuelve x = A” 1b, donde la energía total P(x) es un mínimo. 


Minimización con restricciones 


Muchas aplicaciones agregan ecuaciones extra Cx = d por encima del problema de mini- 
mización. Estas ecuaciones son restricciones. P(x) se minimiza sujeto al requerimiento 
adicional Cx = d. Por lo general x no es capaz de satisfacer n ecuaciones Ax = b y tam- 
bién £ restricciones extra Cx = d. Se tienen demasiadas ecuaciones y se requieren £ incóg- 
nitas más. 

Estas nuevas incógnitas yy, .. . , y¿ Se denominan multiplicadores de Lagrange. In- 
tegran la restricción en una función L(x, y). Esta fue la brillante aportación de Lagrange: 


1 
L(x, y) = P(x) + y “(Cx — d) = ¿Ax xa b+xiCYy — yd. 
El término en L se escoge exactamente de modo que 3L/9 y = O devuelva Cx = d. Cuan- 


do las derivadas de L se igualan a cero, se tienen n + £ ecuaciones para n + £ incógnitas 
YY 
Minimización 9L/0x=0: Ax +CTy=b 4 
restringida 9L/0y =0: Ex =d Le) 
Las primeras ecuaciones implican las misteriosas incógnitas y. Bien podría preguntarse qué 
representan. Estas “incógnitas duales” y indican cuánto el mínimo restringido Pc/ mín (que 
sólo permite a x cuando Cx = d) excede al P,,, no restringido (permitiendo todas las x): 


Sensibilidad del mínimo Pcrmín = Pía + > yUCATb—d)> Poín (5) 


2 2 . A e 
Suponga que P(x1,x2) = 3xí + 3x3. Ciertamente, su valor más pequeño es Pin = 0. 


Este problema no restringido tiene n = 2,4 = [yb =0, Así, la ecuación de minimización 
Ax = b justamente proporciona x, = O y x, = O. 


Z 
FA 
= 
= 
pS 
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Ahora se agrega una restricción c,x¡ + c2x2 = d. Esto coloca a x sobre una recta en 
el plano x,-x2. El minimizador anterior x, = x, = O no está en la recta. La función la- 
grangiana L(x, y) = xi + 1x3 + y(c1x1 + c2x7 — d) tiene n + £ = 2 + 1 derivadas 
parciales: 


IL/0x; =0 Xx Cy >= 0 
9L/0x, =0 Xx +cy=0 (6) 
9L/dy =0 C1X1 + (2%) = d. 
Al sustituir x, = —C;y y x, = —c,y en la tercera ecuación se obtiene —cfy — c2y = d. 
Solución = No x= e x= Be (1) 
22 4. "O dra % dra 


El mínimo restringido de P = 5 Yx se alcanza en ese punto solución: 


1 1 1 02d? + cd? ld? 
P e — E 2 lo 2 mu ler A A 
A (pá IN 2er ES E 


Lo anterior es igual a -; yd, como se pronosticaba en la ecuación (5), ya que b = 0 y 
Psín = 0. 

En la figura 6.5 se muestra el problema que ha resuelto el álgebra lineal, si las restric- 
ciones mantienen a x sobre una recta 2x, — xp = 5. Se está buscando el punto más próxi- 
mo a (0, 0) sobre esta recta. La solución es x = (2, —1). Se espera que este vector más 
corto x sea perpendicular a la recta, y se tiene razón. 





Figura 6,5 Minimización de 3l|x/]? para toda x sobre la recta de restricciones 2x, —x2 = 5. 


Mínimos cuadrados de nuevo 


En minimización, la gran aplicación son los mínimos cuadrados. El mejor x es el vector 
que minimiza el error al cuadrado E? = || Ax — b]?. ¡Esta es una cuadrática y se ajusta a 
nuestro marco de referencia! Esclarecerá las partes que parecen nuevas: 


Error al cuadrado — E? =(Ax-—bY(Ax—b)=x"ATAx—2x A Tb+b"b. (9) 
Compare con a TAx — xYb al inicio de esta sección, que condujo a Ax = b: 


[A cambia a ATA] [b cambia a 4*b] [se suma b*b]. 


La constante b*b eleva toda la gráfica, lo cual no afecta al mejor Y. Los otros dos cambios, 
AenAA y ben A?b, originan una nueva manera de llegar a la ecuación de mínimos cua- 


342 Capítulo 6 Matrices positivas definidas 





drados (ecuación normal). La ecuación de minimización Ax = b cambia a la 
Ecuación por mínimos cuadrados ATAR = Ab. (10) 


El tema de la optimización requiere todo un libro. Nos detendremos mientras sea álgebra 
lineal pura. 


El cociente de Rayleigh 


El segundo objetivo es encontrar un problema de minimización que sea equivalente a Ax 
= Ax, lo cual no es tan fácil. La función a minimizar no puede ser cuadrática, ya que en- 
tonces su derivada tendría que ser lineal, y el problema de valores característicos es no li- 
neal (A multiplicado por x). El truco exitoso es dividir una cuadrática entre otra: 

x Ax 


xx 


DOTA DICTARON ROAD IYRESIA EAST EAN E ORALMENTE 


Cociente de Rayleigh Minimizar R(x) = 





e Pe TS 
A 


TO Principio d de o Rayleigh: 5 Ma mínimo a cociente de le Rayleigh e es Sel me- 
ces Hor. valor característico Aj. RG). alcanza e els mínimo en el o vector característico 





Si se mantiene Ax = 1, entonces R(x) es un mínimo cuando x*x = l|x 1? es lo más gran- 
de posible. Se está buscando el punto sobre el elipsoide xTAx = 1 lo más lejano posible al 
origen: el vector x de mayor longitud. Con base en el análisis que se hizo sobre el elipsoi- 
de, su eje mayor apunta a lo largo del primer vector característico. Así, R(x) es un mínimo 
en Xi 

Algebraicamente es posible diagonalizar la matriz simétrica A por medio de una ma- 
triz ortogonal: OTAQ = A. Luego se hace x = Qy y el cociente se facilita: 


(ON A(Qy) y*Ay Ay yÍ OS DES 


ROO = —_—_—— == E E -AAA= A, ab 
(Q0NU0N yy y 
El mínimo de R es A ,, en el punto en que y, = ly y, =:**=y,=0: 
En todos los puntos — A¡(yi+y¿+=*+* +y2) < (u1yi+ da yi +: Any). 


El cociente de Rayleigh en la ecuación (11) nunca es menor que A, y nunca es mayor que 
A, (el mayor valor característico). Su mínimo está en el vector característico x, y su máxi- 
mo está en Xx, 


T 
Máximo donde ÁAx,, = A, Xan — R(x) = HE == =A,. 


Un detalle pequeño pero importante: el cociente de Rayleigh es igual a a,,, cuando el vec- 
tor ensayo es x = (1,0,..., 0). Así, a, (sobre la diagonal principal) está entre A, y A,. Es- 
to puede verse en la figura 6.6, donde la distancia horizontal a la elipse (donde a, 1? = 1) 
está entre la distancia más corta y la ÚS más larga: 


1 1 
an <= 7% 


Los elementos diagonales de cualquier matriz simétrica están entre A; y A, Para ver más 
claramente lo anterior, la figura 6.6 se trazó para una matriz positiva definida de 2 por 2. 


quees 4A1=<a SÁn. 





Ejemplo 3 


011734 
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elipse "Ax = 1 


Figura 6.6 Ambas, la x = x,¡///A¡ más alejada y la x = x,/./A, más próxima propor- 
cionan xPAx =xTAx = 1. Estos son los ejes mayor y menor de la elipse. 


Entrelazamiento de los valores característicos 


Los vectores característicos intermedios x,, ... , X,-, son puntos silla del cociente de Ray- 
leíigh (derivadas cero, aunque ningún mínimo o máximo). La dificultad con estos puntos es 
que no se tiene ni idea de si R(x) está arriba o abajo de ellos. Esto hace más difícil de esti- 
mar a los valores característicos intermedios Ao, . +. An=1> 

Para este tópico opcional, la clave consiste en encontrar un mínimo o un máximo res- 
tringido. Las restricciones provienen de la propiedad básica de las matrices simétricas: x; 
es perpendicular a los otros vectores característicos. 





Este “principio máximo” hace de A, el máximo sobre todas las v del mínimo de R(x) con 


xy = 0, Esto supone un método para estimar A, sin conocer A. 


Eliminar el último renglón y la última columna de cualquier matriz simétrica: 


AA) =2 — Y2 ES: | 2 -11 A1(B)=1 
ALA) =2 A=|-l 2 —1| se convierte en B = E DB 
ASCA) =2. + /2 D -1. 2 z : 


El segundo valor característico AA) = 2 está por arriba del menor valor característico 
A¡(B) = 1. El menor valor característico A¡(A) = 2 — 2 está por abajo de 1.(B). Así, 
A¡(B) está atrapado entre ambos. 
En este ejemplo se escogió v = (0, O, 1), de modo que la restricción xv = 0 eliminó 
la tercera componente de x (reduciendo así A a B). 


rr ci 
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La fotografía completa es un entrelazamiento de valores característicos: E 

d1(A) E 24(B) S (A) S A1(B) S +>> £ An-1(B) < AnlA). (13) E 

Esto tiene una interpretación natural para un elipsoide, cuando es cortado por un plano que E 

pasa por el origen. La sección transversal es un elipsoide de una dimensión menor. El eje E 

mayor de esta sección transversal no puede ser más largo que el eje mayor de todo el elip- E 

soide: 11(B) > 1,(4). Sin embargo, el eje mayor de la sección transversal es por lo me- ; 

nos tan largo como el segundo eje del elipsoide original: 11(B) < 42(4). De manera E 

É 


semejante, el eje menor de la sección transversal es menor que el segundo eje original, y 
mayor que el eje menor original: 12(4) < A2(B) < As(A). 

Lo mismo puede verse en mecánica. Cuando los resortes y las masas están oscilando, 
suponga que una masa se mantiene en equilibrio. Entonces la menor frecuencia se incre- 
menta, pero no por arriba de A. La mayor frecuencia disminuye, pero no por debajo A... 

Se termina con tres observaciones. Espero que su intuición le indique que son correctas, 


Observación 1 El principio máximo se extiende a subespacios $; de dimensión j: 


Máximo del mínimo Aj+1 = máx [mín RG») |. (14) 
todas las S; | xLS; 


Observación 2 Para A,-,también hay un principio minimax: 


Mínimo del máximo AZ a mín má RG. (15) 
odas 198 3; Xx j 


Sij= 1, se está maximizando R(x) sobre una restricción xv = O. Este máximo está entre 
An—1 Y An no restringidas. La restricción más fuerte hace que x sea perpendicular al vector 
característico superior v = x,,. Así, el mejor x es el siguiente vector característico x,... 1. El 


“mínimo de los máximos” €S A... 1- 


Observación 3 Para el problema generalizado Ax = A4Mx, los mismos principios se cum- 
plen si M es positiva definida. En el cociente de Rayleigh, xx se convierte en Mx: 


de 





Cociente de Rayleigh Al minimizar R(x) = a se obtiene A¡(M”*A). (16) 
X X 


Incluso para masas desiguales en un sistema oscilatorio (M € /), al mantener una masa en 
equilibrio se eleva la menor frecuencia y se disminuye la mayor frecuencia. 


a Conjunto de problemas 6.4 
1. Considere el sistema Ax = b dado por 
A E 0 Xi 4 
== Za E Ol. 
1 | Z A3 4 


Construya la cuadrática correspondiente P(x,, xo, 3), calcule sus derivadas parciales 
9P/09x;, y compruebe que se hacen cero exactamente en la solución deseada. 





10. 


11. 


12. 


13, 
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Complete al cuadrado en P=3xTAx—x"b= (x— Ab) A(x—ATIb) + cons- 
tante. Esto es igual a P,ng, porque el término anterior nunca es negativo. (¿Por qué?) 


Encuentre el mínimo, en caso de haberlo, de P, = 31? +xy +y?-—3y y P,=1x? 
—3 y. ¿Qué matriz A está asociada con P,? 


(Repaso) Otra cuadrática que ciertamente tiene su mínimo en Ax = bes 
] ] 1 
O(x) = 21Ax — bl? = =xPATAx —xATb+-PTb, 
Z 2 Ze 
Al comparar O con P, e ignorar la constante Pb, ¿qué sistema de ecuaciones se ob- 
tiene en el mínimo de O? ¿Cómo se denominan estas ecuaciones en la teoría de míni- 
mos cuadrados? 


Para cualquier matriz simétrica A, calcule la razón R(x) para la elección especial x = 
(1,..., 1). ¿Cómo está relacionada la suma de todos los elementos A; CON Ay Y Ay? 


2 —1 >». 
ConAÁ = El ¿| , encuentre una elección de x con la que se obtenga un menor R(x) 


que la cota 4, <= 2 que proviene de los elementos diagonales. ¿Cuál es el valor míni- 
mo de R(x2)? 

Si B es positiva definida, a partir del cociente de Rayleigh demuestre que el menor va- 
lor característico de A + B es mayor que el menor valor característico de A. 


Si A, y 14, son los menores valores característicos de A y B, demuestre que el menor 
valor característico 9, de A + B es por lo menos tan grande como A, + u¡. (Intente el 
correspondiente vector característico x en los cocientes de Rayleigh.) 


Nota Quizá los problemas 7 y 8 son los resultados más típicos y más importantes 
que resultan fácilmente del principio de Rayleigh, pero no es así en el caso de las ecua- 
ciones de valores característicos. 


Si B es positiva definida, a partir del principio minimax (12) demuestre que el segun- 
do menor valor característico se incrementa al sumar B : 242(A + B) > 22(A). 


Si se eliminan dos renglones y dos columnas de A, ¿qué desigualdades son de esperar 
entre el menor valor característico uu de la nueva matriz y los As originales? 


Encuentre los valores mínimos de 


2 —=x1x2 +x% 


a 2 
X1X2 + Xx5 a Xi 
2x? + 1% 


X 
Ro = 
E MAR 
A partir de la ecuación (11), demuestre que R(x) nunca es mayor que el mayor valor 
característico A,,. 


El principio minimax para A, implica subespacios 5, de dimensión /: 


Equivalente a la ecuación (15) Aj = mín ER RGs)| . 


xenS; 


a) S1 4, es positivo, deduzca que todo $, contiene un vector x con RG) > 0. 

b) Deduzca que S, contiene un vector y = C” lx con y CYACy/y* y > 0. 

c) Concluya que el ¡-ésimo valor característico de CAC, con base en el principio mi- 
nimax, también es positivo, suponiendo de nuevo la ley de la inercia proporciona- 
da en la sección 6.2. 
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14. Demuestre que el menor valor característico A, de Ax = A1Mx no es más largo que la 
razón a,,/m;, de los elementos en las esquinas. 


15. ¿Qué subespacio particular S, en el problema 13 proporciona el valor mínimo 42? En 
otras palabras, ¿sobre qué S, se cumple que el máximo de R(x) es igual a 42? 


16. (Recomendado) A partir de la submatriz cero, decida los signos de los n valores carac- 


terísticos: 

0 Or 

OS 0 IS 

A o 

E 
17. (Mínimo restringido) Suponga que el mínimo sin restringir x = A” *b satisface la 
restricción Cx = d. Compruebe que la ecuación (5) proporciona correctamente 

Pc/mín = Pmin; el término de corrección es cero. 


6.5 EL MÉTODO DEL ELEMENTO FINITO 


En la sección previa sobre principios mínimos se presentaron dos conceptos fundamentales: 
i) Resolver Ax = b es equivalente a minimizar P(x) = 5xTAx — xTb. 
1i) Resolver Ax = A,x es equivalente a minimizar R(x) =xTAx/xTx. 


Á continuación se intentará explicar cómo es posible aplicar estas ideas. 

La historia es larga, ya que estos principios se conocen desde hace más de un siglo. 
En ingeniería, problemas como el doblado de planchas, o problemas de física como el es- 
tado fundamental (función característica) de un átomo, la minimización se ha utilizado pa- 
ra Obtener una aproximación tosca a la solución verdadera. La aproximación tenía que ser 
tosca; las computadoras eran humanas. Los principios i) y 11) ahí estaban, aunque no era 
posible implementarlos. 

Resulta evidente que la computadora conllevaría una revolución. Lo que saltó hacia 
delante fue el método de diferencias finitas, ya que es fácil “discretizar” una ecuación di- 
ferencial. Ya en la sección 1.7, las derivadas se sustituyeron por diferencias. La región fí- 
sica es cubierta con una malla, y u” = Ax) se convirtió en u¡+1 — 24; + Uj-1 = h? f,. En la 
década de 1950 surgieron nuevos métodos para resolver sistemas Au = f que eran muy 
grandes y ralos: actualmente los algoritmos y el hardware son mucho más rápidos. 

Lo que no se reconoció por completo fue que incluso las diferencias finitas se vuelven 
increíblemente complicadas para problemas ingenieriles reales, como las deformaciones 
que experimenta un avión. La verdadera dificultad no estriba en resolver las ecuaciones, 
sino en plantearlas. Para una región irregular el trozo de malla se colocó junto con trián- 
gulos, cuadriláteros o tetraedros. Luego se requirió un método sistemático para aproximar 
las leyes físicas subyacentes. La computadora tuvo que ayudar no sólo en la solución de 
Au = f y Ax = Ax, sino también en su planteamiento. 

Puede conjeturarse lo que ocurrió. Los antiguos métodos están de vuelta, con un nuevo 
concepto y un nuevo nombre. El nuevo nombre es método del elemento finito. La nueva idea 
utiliza más de la potencia de la computadora —en la construcción de una aproximación dis- 
creta, en su resolución y en el despliegue de los resultados — que cualquiera otra técnica en la 
computación científica.” Si la idea básica es simple, las aplicaciones pueden ser complicadas. 


“Por favor, disculpe este entusiasmo; sé que el método puede no ser eterno. 
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do a EEE 2803 
da Ao ñ O 


cin. PE e . Oz Sl AL DEL URUGUAY 
Para problemas en cdta calas “et úñicO' tó Gus AB iBuede discutirse es su costo; me temo 
que mil millones de dólares es una estimación conservadora del costo hasta la fecha. Es- 
pero que algunos lectores tengan el vigor necesario para dominar el método del elemento 
finito y utilizarlo correctamente. 


Funciones ensayo 


Empezando con el clásico principio de Rayleígh-Ritz, se introducirá la nueva idea de los 
elementos finitos. La ecuación puede ser —u” = f(x) con condiciones en la frontera u(0) = 
u(1) = O. Este problema es de dimensión infinita (el vector b se sustituyó por una función 
f. y la matriz A se convierte en —d Z/ dx?). Es posible escribir la energía cuyo mínimo se bus- 
ca, al sustituir los productos internos v*f por integrales de vGo) f(x): 


1 ! 
Energía total P(v) = SU TAv y f= 5 / Vx —v 00) dx = Ajax. (0) 
0 0 


P(u) debe minimizarse sobre todas las funciones v(x) que satisfacen v(0) = v(1) = 0. La 
función que proporciona el mínimo es la solución u(x). La ecuación diferencial se ha con- 
vertido en un principio mínimo, y sólo queda integrar por partes: 


i ! de 1 
/ vi—uM) dx =/ (uy dx — [vv JFZj modo P(v) = il ¿000? - O) dx. 
0 que 2 


El término vv'es cero en ambos límites, ya que v lo es. Así, f(v'(x))? dx es positiva, co- 
mo x"Ax. Se tiene garantizado un mínimo. 

El cálculo exacto del mínimo es equivalente a resolver exactamente la ecuación di- 
ferencial. El principio de Rayleigh-Ritz produce un problema n-dimensional al escoger 
sólo n funciones ensayo V¡(x),..., Va(x). Á partir de todas las combinaciones Y = y, 
VIO) + +++ + y, Va(x) se busca la combinación particular (se denomina U) que minimiza 
P(V). Esta es la idea clave: minimizar sobre un subespacio de Vs en vez de sobre todas las 
ví(x) posibles. La función que proporciona el mínimo es U(x). Es deseable y de esperar que 
U(x) esté próxima a la u(x) correcta. 

Al sustituir V por v, la cuadrática se convierte en 


] 1 1 
LA ¿ovio + vo a [ONO + V dx. (2) 


Las funciones ensayo V se escogen de antemano. ¡Este es el paso clave! Las incógnitas y y, 
. , yn van en un vector y. Luego, P(V) = ) 3y* Ay — yTb se reconoce como una de 


las cuadráticas de costumbre. Los elementos A; de la matriz son f V/V¡dx = coeficien- 
tes de y¿,, Las componentes b, son f V¡f dx. pe a es posible encontrar el míni- 


mo de ¿y"Ay — y"b al resolver Ay = b. En consecuencia, el método de Rayleigh-Ritz 
consta de tres pasos: 


1. Escoger las funciones ensayo V,,..., V. 
2. Calcular los coeficientes A; y b,. 
3. Resolver Ay = b para encontrar U(x) = y, V,C0O) +: cc + ya Va (x). 


Todo depende del paso 1. A menos que las funciones V, (x) sean extremadamente sim- 
ples, los otros pasos serían virtualmente imposibles. Y a menos que alguna combinación de 
los V, esté próxima a la solución u(x) verdadera, estos pasos serán inútiles. Para combinar 
la facilidad de hacer los cálculos y la exactitud, la idea clave que hace exitosos los elemen- 
tos finitos, es el uso de los polinomios por partes como las funciones ensayo Vx). 


A A A KA es ri LANDA SAA 
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Elementos finitos lineales 


El elemento finito más simple y de mayor uso es lineal por partes. En los puntos interio- 
res x, = h,x, = 2h,...,x, = nh se colocan nodos, así como para las diferencias finitas. 
Luego, V, es la “función sombrero” que es igual a 1 en el nodo x;, y cero en todos los de- 
más nodos (véase la figura 6.74). Está concentrado en un pequeño intervalo alrededor de 
su nodo, y es cero en todas las demás partes (incluyendo x = O y x = 1). Cualquier com- 
binación y¡V1 + *** + ynV, debe tener el valor y, en el nodo f (los otros Vs son cero ahí), 
de modo que resulta fácil trazar su gráfica (véase la figura 6.75). 


Vaz) 


E Pots! pad 
y ma) p! SONAS: 
A RRA RR AER INRRRNRNOAN IA ECN , SUS 
6 





0 ZTj¿ = 4h 1 
a) b) 


Figura 6.7 Funciones sombrero y sus combinaciones lineales. 


En el paso 2 se calculan los coeficientes A;; = f V/V; dx en la “matriz de rigidez” A. 
La pendiente v; es igual a 1/h en el pequeño intervalo a la izquierda de x,, y a—1/h en el 
intervalo a la derecha. Si estos “intervalos dobles” no se traslapan, el producto V ¡v; es ce- 
ro y A;¡ = O. Cada función sombrero se traslapa consigo misma y con sólo dos vecinos: 





. E a Ne e 2 
En la diagonal ¡ = / Au = |] V¡V, dx = z dx + => dx = 7 
Fueradela ,_. a Ad E a e. 
diagonal ES J vivas al (7) (5) 2 AE 
Así, la matriz de rigidez es realmente tridiagonal: 
Al 
1 e! ¿| 
Matriz de rigidez A =-— —1 2 —1 
és A 2D 
1 Z 


¡Esto se ve como diferencias finitas! Ha conducido a miles de discusiones sobre la relación 
entre estos dos métodos. Elementos finitos más complicados —polinomios de grado supe- 
rior, definidos sobre triángulos o cuadriláteros para ecuaciones diferenciales parciales— 
también producen matrices ralas. Podría pensarse que los elementos finitos es una forma 
sistemática para construir ecuaciones en diferencias exactas sobre mallas irregulares. La 
cuestión esencial es la sencillez de estos polinomios por partes. Dentro de cada elemento, 
sus pendientes son fáciles de calcular e integrar. 

Las componentes b, en el miembro derecho son nuevas. En vez de simplemente con- 
tar con el valor de fen x;, como para las diferencias finitas, ahora son un promedio de f 
alrededor de ese punto: b; = f V;f dx. Luego, en el paso 3, se resuelve el sistema tri- 
diagonal Ay = b, que proporciona los coeficientes en la función ensayo minimizadora 
U =yV, +: * +y2 Vs Al unir todas estas alturas y, con una recta quebrada, se obtiene la 
solución aproximada U(o. 


dy a 
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—u" = 2 con u(0) = u(1) =0, y solución u(x) = x—x?. 


La aproximación usa tres intervalos y dos funciones sombrero, con h = 3. La matriz 
Á es de 2 por 2. El miembro derecho requiere integración de la función sombrero multipli- 
cada por f(x) = 2. Lo anterior produce el doble del área z bajo el sombrero: 


A E 
E 2 2) 


La solución de Ay = bes y = (3, 5). La mejor U (x) es ; Y, + 5 V, que es igual a2 en los 


9 
e ze es PS O! 
puntos de la malla. Esto coincide con la solución exacta U(x) =x 1% =3— j.. 


En un ejemplo más complicado, la aproximación no es exacta en los nodos. Aunque 
está extraordinariamente próxima. La teoría subyacente es explicada en el libro del autor 
An Analysis of the Finite Element Method (consulte la página www. wellesleycambridge 
. com) escrito al alimón con George Fix. En otros libros se proporcionan aplicaciones más 
detalladas, y el tema de los elementos finitos se ha convertido en una parte importante de 
la educación de la ingeniería. Se aborda en Introduction to Applied Mathematics, y también 
en mi nuevo libro Applied Mathematics and Scientific Computing. Ahí se analizan ecua- 
ciones diferenciales parciales, donde el método realmente se encuentra en su medio. 


Problemas de valores característicos 


El concepto de Rayleigh-Ritz —-minimizar sobre una familia de dimensión finita de Vs en 
lugar de hacerlo sobre todas las vs admisibles— también es de utilidad para los problemas 
de valores característicos. El verdadero mínimo del cociente de Rayleigh es la frecuencia 
fundamental A. ,. Su mínimo aproximado Á, es más grande, ya que la clase de funciones 
ensayo se ha restringido a los Vs. Este paso era completamente natural e inevitable: aplicar 
las nuevas ideas del elemento finito a esta forma variacional del problema de valores ca- 
racterísticos establecida hace bastante. 
El mejor ejemplo de un problema de valores característicos tiene u(x) = sen 1rx y 
A 7 are; 
Función característica u(x) —=u”" = Au, con  u(0) = u(1) =0. 
Esta función sen 1rx minimiza el cociente de Rayleigh v"Av/v*v: 
! 1 

SL vo GA) da S.A da 
vu HARE A 07 OE, 

So WAY? dx S, (Uy? dx 
Esta es una razón de energía potencial a energía cinética, y están en equilibrio en el vector 


característico. Normalmente este vector característico es desconocido, y para aproximarlo 
es necesario admitir sólo los candidatos de ensayo Y = y, V, + +++ + y,Va: 
1 
OVER AN 


RV) = LAA 
EGV+ o +yV)dx y "My 


Cociente de Rayleigh R(v) 





A continuación se aborda el problema matricial: Minimizar y*Ay/y*M y. Con M = I, lo 
anterior conduce al problema de valores característicos estándar Ay = Ay. Sin embargo, la 
matriz M es tridiagonal, ya que la aproximación a esta función se traslapa. Es exactamente 
la situación que conlleva el problema generalizado de valores característicos. El valor mí- 
nimo A, es el menor valor característico de Ay = 1My. Esta A, está próxima a (y por 
arriba de) a”. El vector característico y proporciona la aproximación U = y¡V, + *** + 
Ya Y, 2 la función característica. 
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Así corno en el problema de estática, el método puede resumirse en tres pasos: 1) es- 


coger los V;, 2) calcular A y M, y 3) resolver Ay = AMy. No sé por qué esto cuesta mil mi- 
llones de dólares. 


Conjunto de problemas 6.5 


1. 


Use tres funciones sombrero, con h = z, para resolver —u” = 2 con u(0) = u(1) = 0. 
Compruebe que la aproximación U coincide con u = x —x? en los nodos. 


Resuelva -u” = x con u(0) = u(1) = O. Luego resuelva aproximadamente con dos 


funciones sombrero y h = 3. ¿Dónde está el error más grande? 


Suponga que —u” = 2, con la condición en la frontera u(1) = O cambiada a u'(1) = 0. 
Esta condición “natural” sobre u” no requiere ser impuesta sobre las funciones ensayo 
V. Conh = z existe un semisombrero extra V3, que va de O a 1 entre x = 3 yx=l. 
Calcule Aza = [(V¿ dx y fa = $ 2V3 dx. Resuelva Ay = f para la solución del ele- 
mento finito y, Y, + y2V2 + y3V3. 

Resuelva —u” = 2 con una sola función sombrero, pero coloque su nodo en x = : en 


vez de x = 3. (Trace esta función V;,.) Con condiciones a la frontera 4(0) = (1) = 0, 
compare la aproximación por elementos finitos con la u = x—x* verdadera. 


El método de Galerkin empieza con la ecuación diferencial (por ejemplo —u” = fc) 
en vez de con la energía P. La solución ensayo sigue siendo u = y, V¡ + y2 Va +: + 


Ya Vn, y las ys se escogen para hacer que la diferencia entre —u” y f sea ortogonal para 
todo V;: 


Galerkin [> e O A freove dx. 


Integre por partes el miembro izquierdo para llegar a Ay = f] demostrando que el mé- 
todo de Galerkin proporciona las mismas A y f que Rayleigh-Ritz para problemas si- 
métricos. 


Una identidad fundamental para cuadráticas demuestra y = Ab como la minimiza- 
ción de: 


] 1 1 
P(y) = ES — yb = 7 — ATIDYA(y — Ab) — ¿PAT b. 


El mínimo sobre un subespacio de funciones ensayo está en la y más próxima a A“! b, 
(Esto hace lo más pequeño posible al término de la derecha; constituye la clave para 
la convergencia de U au.) Si A =1y b = (1, 0, 0), ¿qué múltiplo de Y = (1, 1, 1) 
proporciona el menor valor para P(y) = 5y* y — y1? 


Para una simple función sombrero V(x) centrada en x = 2 calcule A = S (VI dx y 
M = f V? dx. En el problema de valores característicos de 1 por 1, ¿A = A/M es 
mayor o menor que el verdadero valor característico A = 1%? 
Para las funciones V, y V, centradas en x = h = ; y x= 2h= 5, calcule la matriz 
masa de 2 por 2 M;¡¿ = f V¿V¡dx, y resuelva el problema de valores característicos 
Ax = AMx. 

1 


¿Cuál es la matriz masa M,¡ = f V¿V;¡dx para n funciones sombrero con kh = 7? 
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Lálculos con matrices 


7.1 INTRODUCCIÓN 


Uno de los objetivos de este libro es explicar las partes útiles de la teoría de matrices. En 
comparación con libros más antiguos sobre álgebra lineal abstracta, la teoría subyacente no 
ha cambiado radicalmente. Una de las mejores cosas sobre el tema es que la teoría es real- 
mente esencial para las aplicaciones. Lo que es diferente es el cambio en el énfasis que vie- 
ne con un nuevo punto de vista. La eliminación se convierte en más que justo una forma de 
encontrar una base para el espacio renglón, y el proceso de Gram-Schmidt no sólo es una 
demostración de que todo subespacio tiene una base ortonormal. En vez de lo anterior, real- 
mente se necesitan estos algoritmos. Y se requiere una descripción conveniente, A = LU 
o A = OR, de lo que hacen aquéllos. 

Este capítulo avanzará unos pasos más en la misma dirección. Supongo que estos pasos 
están regidos por la necesidad computacional, más que por la elegancia, y no sé dónde pedir 
disculpas por esto; los hace sentir muy superficiales, lo cual es erróneo. Tratan con los pro- 
blermas más antiguos y fundamentales del tema, Ax = b y Ax = Ax, aunque cambian y mejo- 
ran continuamente. En análisis numérico hay un remanente de la prueba de ajuste, y se desea 
describir algunos conceptos que han prevalecido. Éstos pueden clasificarse en tres grupos: 


1. Técnicas para resolver Ax = b. La eliminación es un algoritmo perfecto, excepto 
cuando el problema en cuestión tiene propiedades especiales, como ocurre con casi todos 
los problemas. En la sección 7.4 la atención se centrará en la propiedad de ser ralo(a), 
cuando la mayor parte de los elementos en A son cero. Para resolver Ax = b se desarro- 
llan métodos iterativos en vez de directos. Un método iterativo se “corrige a sí mismo”, y 
nunca llega a la respuesta exacta. El objeto es aproximarse más rápidamente que la elimi- 
nación. En algunos problemas esto es posible; en muchos otros, la eliminación es más se- 
gura y rápida si aprovecha los ceros. La competencia está lejos de terminar, y se identificará 
el radio espectral que controla la velocidad de convergencia ax = A7?b, 


2. Técnicas para resolver Ax = Ax. El problema de valores característicos es uno de 
los extraordinarios éxitos del análisis numérico. Está definido claramente, su importancia 
es evidente, aunque hasta no hace mucho nadie sabía cómo resolverlo. Se han sugerido do- 
cenas de algoritmos, y todo depende del tamaño y de las propiedades de A (y del número 
de valores característicos que se quieren). El lector puede solicitar LAPACK, una subruti- 
na para valores característicos, sin conocer su contenido, aunque es mejor conocerlo. He- 
mos escogido dos o tres conceptos que han sustituido a casi todos sus predecesores: el 
algoritmo OR, la familia de “métodos de potencias” y el reprocesamiento de una matriz 
simétrica para hacerla tridiagonal. 
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MIRAR SUN AAA 


Los dos primeros métodos son iterativos, y el último es directo. Hace su trabajo en un 
número finito de pasos, aunque no termina con los valores característicos en sí. Esto pro- 
duce una matriz mucho más simple de utilizar en los pasos iterativos. 


3. El número de condición de una matriz. En la sección 7.2 se intenta medir la “sen- 
sibilidad” de un problema: si A y B se modifican ligeramente, ¿cuán grande es el efecto so- 
bre x = A71b? Antes de abordar esta pregunta, se requiere un método para medir A y el 
cambio AA. La longitud de un vector ya se ha definido, y ahora se necesita la norma de 
una matriz. Luego el número de condición, y la sensibilidad de A se concluyen al multi- 
plicar las normas de A y 4”*. Las matrices de este capítulo son cuadradas. 


AO UD A NAS 


AOS 


E 


BE 7.2 NORMA DE UNA MATRIZ Y NÚMERO DE CONDICIÓN 


Un error y una metedura de pata son cosas muy distintas. Un error es una pequeña equivo- 
cación, quizá inevitable incluso para un matemático perfecto o una computadora perfecta. 
Una metedura de pata es mucho más seria, y por lo menos un orden de magnitud mayor. 
Cuando la computadora redondea un número después de 16 bits, eso es un error. Pero cuan- 
do un problema es tan espantosamente sensible que este error de redondeo cambia por 
completo la solución, entonces casi con toda seguridad alguien ha metido la pata. Nuestro 
objetivo en esta sección es analizar el efecto de los errores con la finalidad de evitar las me- 
teduras de pata. 
En realidad, se está continuando un análisis que empezó en el capítulo 1 con 


11 0.0001 1 
a=| bieix | y B=|; i 

Se afirmó que B está bien acondicionada, y no es particularmente sensible al redondeo, ex- 
cepto que si la eliminación gaussiana se aplica de manera imprudente, entonces la matriz 
se vuelve completamente vulnerable. Una metedura de pata es aceptar a 0.0001 como el 
primer pivote, por lo que es necesario insistir en una elección más grande y segura, me- 
diante un intercambio de renglones de B. Cuando “pivoteo parcial” se integra al algoritmo 
de eliminación, la computadora busca automáticamente los pivotes más grandes. Así, la re- 
sistencia natural al error por redondeo deja de estar comprometida. 

¿Cómo se mide esta resistencia natural, y se decide si una matriz está bien acondicio- 
nada o mal acondicionada? Si hay un cambio ligero en b o en A, ¿cuán grande es el cam- 
bio que esto produce en la solución x? 

Se empieza con un cambio en el miembro derecho, de b a b + 8b. Este error podría 
deberse a los datos experimentales o al redondeo. Puede suponerse que 3h es pequeño, pe- 
ro su dirección está fuera de nuestro control. La solución ha cambiado de xa x +8x: 


Ecuación de error A(x + 8x) = b + 8b, de modo que, por sustracción, A(8x) = 8b. (1) 


Un error 8b conduce a ¿x = 47!8b. En la solución x hay un gran cambio cuando A”? es 
grande, Á es casi singular. El cambio en x es especialmente grande cuando 3b apunta en la 
dirección que es más amplificada por 47” ?. 

Suponga que Á es simétrica y que sus valores característicos son positivos: 
0<41 £-** < An. Cualquier vector db es una combinación de los vectores característi- 
cos unitarios correspondientes x;, ..., Xy. El peor error dx, que proviene de A”?, es en la 
dirección del primer vector característico x,: 


Peor error Si ¿b=ex,, entonces ¿x = 


db 
e (2) 





Ejemplo 1 


o siempre, satisfacen 
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El error |10b|| es amplificado por 1 / 4, que es el mayor valor característico de A”?, Esta 
amplificación es máxima cuando A, está próximo a cero, y Á es casi singular. 

Medir la sensibilidad completamente, por medio de A, tiene una seria desventaja. Su- 
ponga que todos los elementos de A se multiplican por 1000. Así, A, se multiplica por 1000 
y la matriz se verá mucho menos singular. Esto ofende nuestro sentido del juego justo; un 
reescalamiento tan simple no puede corregir a una matriz mal acondicionada. Es cierto que 
$x será 1000 veces menor, pero lo mismo ocurre a la solución x = A7*b. El error relativo 
18x11/l1xI] será el mismo. Al dividir entre [ld], el problema vuelve a normalizarse contra un 
cambio trivial de escala. Al mismo tiempo hay una normalización para 9b. Nuestro proble- 
ma es comparar el cambio relativo ||8b|| / b]| con el error relativo ||¡8x|| / llac!. 


El peor de los casos es cuando ||Ó$x]| es grande ——<on db en la dirección del vector ca- 
racterístico x¡—, y cuando ||x/| es pequeña. La verdadera solución x debe ser lo más peque- 
ña posible en comparación con la b verdadera. Esto significa que el problema original 
Ax = b debe estar en el otro extremo, en la dirección del último vector característico x,,: si 
b = x,, entonces x = AT!b = bl) ,. 

Es esta combinación, b = x.,, y 8b = ex,, lo que hace al error relativo lo más grande 
posible. Estos son los casos extremos en las siguientes desigualdades: 


AN" se 











ad e E q o e TON 





e. > A a 
4 A. e? A MN 





Lar razón, a 1 onto! 


Los valores característicos de A son aproximadamente A, = 107*/2y 4,2 = 2: 


A 1 1 a ñ de" A E Y 4 
A = h 1.000 3 tiene número de condición aproximado de c =4-10”. 


Debe esperarse un cambio brusco en la solución debido a los cambios normales en los da- 
tos. En el capítulo 1] se compararon las ecuaciones Ax = b y Ax' = b': 


u + v=2 u + v 2 
u + 1.0001v = 2 u + 1.000l1v = 2.0001. 


!l 


Il 


Los miembros derechos sólo han cambiado por I351| = 0.0001 = 107*. Al mismo tiempo, 
la solución va de u =2,v=0au= uy = ]. Este es el error relativo de 


ISx | _ I(—1,DI _ Ya 1912 


== o . QUe es igual a 
lloc 12, ON - 151] 


Sin haber hecho ninguna elección especial de la perturbación, en la solución se observa un 
cambio relativamente grande. Las x y $b forman ángulos de 45? con los peores casos, lo 
cual explica el 2 faltante entre 2 - 10* y la posibilidad extrema c = 4 - 10. 


Si A = Jo incluso si A = 1/10, su número de condición es c = Amáx/ Amia = 1. Por 
comparación, el determinante es una medida terrible del mal acondicionamiento. Depen- 
de no sólo del escalamiento, sino también del orden n: si A = 1/10, entonces el determi- 
nante de A es 10””. De hecho, esta matriz “casi singular” está lo mejor acondicionada 
posible. 
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Ejemplo 2 


La matriz diferencia finita A de n por n tiene Amaáx == 4 Y Amín = 72/ RE 


A 
+] a! 
A = =L 2 


A! 
sl 2 
El número de condición es aproximadamente c(A) = En? y esta vez la dependencia res- 
pecto al orden n es genuina. Mientras mejor se aproxime a —u” = f, incrementando el nú- 
mero de incógnitas, más difícil es calcular la aproximación. En cierto punto de intersec- 
ción, un incremento en n produce en realidad una respuesta más deficiente. 
Afortunadamente para el ingeniero, esta intersección ocurre donde la precisión es bas- 
tante buena. Al trabajar con precisión simple, una computadora típica podría hacer errores 
por redondeo del orden de 107?. Con n = 100 incógnitas y c = 5000, el error se amplifica 
cuando mucho, de modo que es del orden de 107*, lo cual sigue siendo más preciso que 
cualquier medición normal. Sin embargo, con 10 000 incógnitas se tiene un problema, o con 
una aproximación 1, —4, 6, -4, 1 a d*u/dx* = f(x), para la cual el número de condición 
crece con n?*.” 


Matrices no simétricas 


Hasta el momento, nuestro análisis ha sido aplicado a matrices simétricas con valores ca- 
racterísticos positivos. La hipótesis de positividad puede abandonarse fácilmente, y usar 
sólo valores absolutos |A]. Pero para ir más allá de la simetría, como ciertamente se quie- 
re, debe haber un cambio fundamental. Esto puede verse fácilmente para las matrices bas- 
tante no simétricas 


_ ¿1 100 a 100 (4) 
alo] amo A) 
Todos los valores característicos son iguales a la unidad, aunque el número de condición 
idóneo no €S Amáx/ Amin = 1. El cambio relativo en x no está acotado por el cambio relati- 
vo en b. Compare 


NS. a ELOO;: pu 1400 e BOO 
x= $ cuando o=| de x= : cuando y =| : 


Un cambio de 1% en b ha producido un cambio centenario en x; el factor de amplificación 
es 100%. Debido a que c representa una cota superior, el número de condición debe ser por 
lo menos 10 000. La dificultad aquí es, que un gran elemento fuera de la diagonal en A sig- 
nifica un elemento igualmente grande en A” *. A menudo es erróneo esperar que A”! se ha- 
ga más pequeña a medida que A se hace más grande. 

Para una definición idónea del número de condición, se considera nuevamente la ecua- 
ción (3). Se está intentando hacer pequeño a x y grande a b = Ax. Cuando A no es simétri- 
ca, el máximo de || Ax || [lx Il puede encontrarse en un vector x que no es uno de los vectores 
característicos. Este máximo es una excelente medida del tamaño de A. Es la norma de A. 


“La regla empírica, comprobada experimentalmente, es que la computadora puede perder log c ci- 


fras decimales debido a los errores de redondeo en la eliminación gaussiana. 








* " al Slds 
A O Sn 
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[Axl < 1141 ben 


Las matrices A y A7* en la ecuación (4) tienen normas ubicadas en alguna parte entre 
100 y 101. Es posible calcularlas exactamente, pero primero se desea completar la relación 
entre las normas y los números de condición. Debido a que b = Ax y 8x = A7*8b, la ecua- 
ción (6) proporciona 


ol < Alle] y 8x1 < 147 118D1. (1) 


Esta es la sustitución de la ecuación (3), cuando A no es simétrica. En el caso en que es si- 
métrica, ]|A |] es la misma que Amax, y IA 7*]] es lo mismo que 1/A min. La sustitución correc- 
ta para Xesx mín es el producto ¡A !11147*)], que es el número de condición. 


pa EN len 185 
AS en hee AN 


y E NSAL. Es ctamente d 
OA AAAAAAKÁ < Laca ER ETA E, A Sr a 4 
E NA] quese - 





Lo que es extraordinario es que el mismo número de condición aparece en la ecuación (9), 
cuando se perturba la matriz misma: Si Ax = b y (A + 84 Xx + 8x) = b, entonces por 
sustracción 


Aéx +8A(x +8x) = 0, O 8x = —ATUSAMx + 8x). 


Al multiplicar por 44 se amplifica un vector por no más de ||$A|]], y al multiplicar por A”? 
se amplifica por no más de |A”*||. Luego, |l$x]] < |47* ISA] lx + 8x ||, que es 
|6x |] E l dE IIS Al] 

ens NA“ pNSAl =c LA (10) 

Estas desigualdades significan que el error por redondeo proviene de dos fuentes. Una 
es la sensibilidad natural del problema, medida por c. La otra es el error verdadero db o 
JA. Esto constituyó la base del análisis de error de Wilkinson. Debido a que la eliminación 
realmente produce factores aproximados L* y U”, resuelve la ecuación con la matriz erró- 
nea A + ÍA = LU”, en vez de hacerlo con la matriz correcta A = LU. Wilkinson demos- 
tró que el pivoteo parcial controla A, de modo que la carga del error por redondeo es 
llevada por el número de condición c. 


Una fórmula para la norma 


La norma de A mide la mayor cantidad por la cual cualquier vector (vector característico O 
no) es amplificado por la matriz multiplicación: [[4]] = máx ([14x]| l llxiD. La norma de la 
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matriz identidad es 1. Para calcular la norma, ambos miembros se elevan al cuadrado para 
llegar a la ATA simétrica: 





(ART RADAR 


[AI = máx (1D) 


in | 
lx 11? x*x 






e e E 
A Ama ATA) = [A 11?. 





LADA 






VEA pd tal A 
a A IS TÍ 


En la figura 7.1 se muestra una matriz no simétrica con valores característicos A, = 


A, = 1 y norma J¡Al| = 1.618. En este caso 4”* tiene la misma norma. Los puntos más 
alejado y más próximo Ax sobre la elipse provienen de los vectores característicos de ATA, 
no de A. 
dl: 
A= 1 +5 
E , la == 


MATH = Amín( ATA) = 0.382 
AJA] = (1.618)* 


2 
E 
I 


elipse total de Az círculo ljx|| = 


Figura 7.1 Las normas de A y A”! provienen de la Ax más larga y más corta. 


Nota 1 La norma y el número de condición no se calculan realmente en la práctica, sino 
que sólo se estiman. No hay tiempo para resolver un problema de valores característicos 
para Ami ATA). 


Nota 2 En la ecuación por mínimos cuadrados ATAx = A*b, el número de condición 
c(ATA) es el cuadrado de c(A). Al formar ATA, un problema sano puede convertirse en uno 
enfermo. Quizá sea necesario ortogonalizar A con el proceso de Gram-Schmidt, en vez de 
calcularla con ATA. 


Nota 3 Los valores singulares de A en la DVS son las raíces cuadradas de los valores 
característicos de ATA. Por la ecuación (12), otra fórmula para la norma es lA = Omnax. 
Las matrices ortogonales U y V dejan sin cambio las longitudes en |lAxl| = ¡U E VTx]]. 
Así, el mayor || 4xl| Z lxl| proviene del mayor o en la matriz diagonal 2. 


Nota 4 El error por redondeo también entra en Ax = Ax. ¿Cuál es el número de condi- 
ción del problema de valores característicos? El número de condición de la matriz de dia- 
gonalización S mide la sensibilidad de los valores característicos. Si ¡4 es un valor 
característico de A + £, entonces su distancia a uno de los valores característicos de A es 


lA] SISSI LEI =c(SMEI. (13) 





E 
ES 
É 
E 
S 
a 
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Con vectores característicos ortonormales y S = O, el problema de valores característicos 
está perfectamente acondicionado: c(Q) = 1. El cambio $4 en los valores característicos no 
es mayor que el cambio $4. En consecuencia, el mejor de los casos es cuando A es simétri- 
ca, o más generalmente, cuando 44? = A*A. Entonces A es una matriz normal; su $ diago- 
nalizadora es una Q ortogonal (véase la sección 5.6). 

Si x, es la k-ésima columna de S y y, es el k-ésimo renglón de S”?, entonces A, cam- 
bia por 


84; = y; Ex, + términos de orden || £ ||?. (14) 


En la práctica, y¿£x, es una estimación realista de 91. La idea en todo buen algoritmo es 
mantener la matriz error £ lo más pequeña posible —usualmente al insistir, como se hará 
en la siguiente sección, en matrices ortogonales en cada paso del cálculo de A. 


Conjunto de problemas 7.2 


1. Para una matriz ortogonal O, demuestre que [|Q]| = 1 y también que c(Q) = 1. Las 
matrices ortogonales (y sus múltiplos 40) son las únicas matrices perfectamente acon- 
dicionadas. 


2. ¿Qué “famosa” desigualdad proporciona |(A + B)xll < llAx ll + 1 Bx 1], y por qué se 
concluye de la ecuación (5) que ||A + Bl < [All + 118112 


3. Explique por qué | ABxI| < JAI 11811 lloc ]], y concluya de la ecuación (3) que [¡AB]| < 
1141111811. Demuestre que esto también implica c(AB) < c(A)c(B). 


4. Para la matriz positiva definida A = Es Ea calcule | AT? = 1/41, AI = Az, 


y C(A) = 12/41 Para un miembro derecho b y una perturbación db de modo que el 
error sea el peor posible, l8x 1 /llxl] = cli8bI] /Nbll. 


5. Demuestre que si A es cualquier valor característico de A, Ax = Ax, entonces ||Al] < 
A!1. 


6. Las matrices en la ecuación (4) tienen normas entre 100 y 101. ¿Por qué? 
7. Compare los valores característicos de ATA y AA, para demostrar que [14 || = [14%]. 


8. Para una matriz positiva definida A, la descomposición de Cholesky es A = LDL? = 
RYR, donde R = Y/DLT. A partir de la ecuación (12), demuestre directamente que el 
número de condición de c(R) es la raíz cuadrada de c(4). La eliminación sin intercam- 
bios de renglones no puede afectar a una matriz positiva definida, ya que c(4) = 
aRBDCA RA). 

9. Demuestre que máx/|A| no es una norma verdadera, encontrando contraejemplos de 2 
por 2 para AmáxlA + B) S Amáxl) + Amax(B) Y AmaxlAB) S Amáxl A) Amax(B). 


10. Demuestre que los valores característicos de B = | an E] son + 0,, los valores sin- 


gulares de A. Sugerencia: Intente B?. 


M. a) AyA' ?, ¿tienen el mismo número de condición c? 
b) En paralelo con la cota superior (8) sobre el error, demuestre una cota inferior: 


[8x1 _ 111801 


> . (Considere A“ lb = x en vez de Ax = b.) 
lx — < 101 
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12. Encuentre las normas A... y los números de condición Amáx/ Ami, de las siguientes ma- 
trices positivas definidas: 

Sl 

ha) 


EE 


13, Encuentre las normas y los números de condición, a partir de las raíces cuadradas de 
AmáxlA*A) e Amnl ATA): 
¡| 
E 


de. O 1 1 
gd 2 070 
14. Demuestre que el número de condición ([A[| 4” *]| es por lo menos 1. 


15. ¿Por qué [es la única matriz positiva definida simétrica que cumple Amáx = Amín = 1? 
Así, las únicas matrices con [A || = 1 y [147*]] = 1 deben cumplir AA = 7. Son ma- 
trices 





16. Las matrices ortogonales tienen norma [JO | = 1. Si A = OR, demuestre que l¡Al| < 
IR] y también que [|[R]] < 141]. Así, 141] = 1101) ]R |. Encuentre un ejemplo de A = 
LU con [JAI] < 12111101. 


17. (Sugerido por Moler y Van Loan) Calcule b — Ay y b — Az cuando 


OL a 050063 _f 0.341 _[ 0.999 
— 10.254 50/0193 006591 7 =0087 *.l=n0. 


Para resolver Ax = b, ¿y está más próximo que z? Conteste en dos formas: Compare 
el residuo b — Ay con b — 47. Luego compare y y z con el verdadero x = (1, —1). Al- 
gunas veces se desea un residuo pequeño, y algunas veces, un dx pequeño. 


Los problemas 18 a 20 son sobre normas vectoriales distintas a la norma de costum- 

bre [lx || == Yx -x. 

18. La “norma £?*” es lx), = lx,[ ++ -- + lx, 1. La “norma £%” es llxllo. = máx bx). 
Calcule llell, lloc] ;, y lx llo para los vectores 


deL) y x =(0.1,0.7, 0.3, 0,4, 0.5). 


19. Demuestre que llxl[.. <= lxe]] < l]xl],. A partir de la desigualdad de Schwarz, demuestre 
que las razones ||.x/] / llolloo y HUxll il lx] nunca son mayores que _/n. ¿Con qué vector 
(x1, «+. , x,) se obtienen razones iguales a ./n? 


20. Todas las normas vectoriales deben cumplir la desigualdad del triángulo. Demuestre 
que 


lx + y llo < llXlloo + llYlloo. y Uwe +ylli< lll + ly Hr. 


21. Por eliminación, calcule la inversa exacta de la matriz de Hilbert A. Luego, calcule de 
nuevo A”? redondeando todos los números hasta tres cifras: 


En MATLAB: A = hilb(3) = 


Lhaj Dajre o pues 
Bj Luje ui 
lap Ai Qja 


22. Para la misma A, calcule b = Ax para x = (1, 1, 1) y x = (0, 6, —3.6). Un cambio pe- 
queño Ab produce un gran cambio Ax. 
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23. Calcule Amáx Y Ami para la matriz de Hilbert de 8 por 8 a; = 1(i + j—1). Si Ax = 
b con I¡bl|= 1, ¿cuán grande puede ser [|x|]? Si el error por redondeo de b es menor 
que 107*S, ¿cuán grande es el error que esto puede provocar en x? 


24. Si se conocen £, U, O, y R, ¿qué es más rápido resolver, LUx = bo ORx = b? 


25. Escoja el pivote más grande disponible en cada columna (pivoteo parcial), para facto- 
rizar cada A en PA = LU: 


10.1 
a= (32 y A=|2 20 
0.2.0 


26. Encuentre la factorización LU de A = É Al En su computadora, resuelva por eli- 


minación cuando e€ = 107?, 1074, 107?, 107%, 107*: 


IES 


El x verdadero es (1, 1). Elabore una tabla para mostrar el error para cada e. Intercam- 
bie las dos ecuaciones y vuelva a resolver: los errores casi deben desaparecer. 


7.3 CÁLCULO DE VALORES CARACTERÍSTICOS 


No hay ninguna forma mejor que otra para encontrar los valores característicos de una ma- 
triz. Sin embargo, ciertamente existen algunas formas terribles que nunca deben intentar- 
se, así como también algunas ideas que merecen un sitio permanente. Empezamos con la 
descripción de un método bastante fácil y aproximado: el método de potencias, cuyas pro- 
piedades de convergencia son fáciles de comprender. Para demostrar este método en ac- 
ción, en la página del curso web.mit.edu/18.06 se agregó una animación gráfica (sonora). 

De manera continua nos dirigimos hacia Otro algoritmo más complicado, que empie- 
za por hacer tridiagonal a una matriz simétrica y termina por hacerla virtualmente diago- 
nal. Este segundo paso se realiza repitiendo el proceso de Gram-Schmidt, por lo que se 
denomina método OR. 

El método de potencias normal opera, con base en el principio de una ecuación en 
diferencias. Empieza con una conjetura inicial uy y sucesivamente forma u; = Aug, Uy = 
Au, y en general uz+, = Au. Cada paso es una multiplicación matriz-vector. Luego de k 
pasos produce u¿ = A*up, aunque la matriz A* nunca aparece. La cuestión esencial es que 
la multiplicación por A debe ser fácil —si la matriz es grande, mejor sería si fuese rala— 
debido a que la convergencia al vector característico a menudo es muy lenta. Supontendo 
que A tiene un conjunto completo de vectores característicos x;, . .. , X,, el vector 1, está 
dado por la fórmula de costumbre: 


Vectores característicos ponderados porA% uz; =cMjx1 + ** +CnArXn» 


Suponga que el valor característico más grande A,, es todo en sí: no hay otro valor caracte- 
rístico de la misma magnitud, y |A4] < -+- < | An-1] < [Ar]. Entonces, a medida que la 
conjetura inicial “y contenía alguna componente x,, del vector característico, de modo que 
c, % 0, esta componente domina gradualmente en 4;: 


Uk A: á An—1 , 
a C; o Sd .... ea AA y Xar—1 => CnXn- dd) 


As n r 





e A ÁS E 
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Ejemplo 1 


Los vectores u, apuntan cada vez con mayor precisión hacia la dirección de x,. Su factor 
de convergencia es la razón r = lAa-11/14,1. Es justo como la convergencia hacia un esta- 
do estacionario, para una matriz de Markov, excepto que ahora A,, puede no ser igual a 1. 
El factor de escalamiento A% en la ecuación (1) evita que 1, se vuelva muy grande o muy 
pequeño, en caso de que |A, | > 10 |A,] < 1. 

A menudo apenas es posible dividir cada u, entre su primera componente «, antes 
de continuar con el paso siguiente. Con este simple escalamiento, el método de potencias 
Ux+1 = Auy/a , converge a un múltiplo de x,.. Los factores de escalamiento a, tienden a 1,, 


213 .667 09: 90:2 4 
El u, tiende al vector característico al e bed] cuando Á = he $1 es la matriz 


de movimientos de población en la sección 1.3: 


E! 10.9 0 E _ 0.781 40.747 
En E A be! a ad di Hue de peral 
Sir = lA,-11/]4,] es próximo a 1, entonces la convergencia es muy lenta. En muchas 
aplicaciones r > 0.9, lo cual significa que para alcanzar un dígito más se requieren más de 
20 iteraciones. (En el ejemplo se tenía r = 0.7, y aun así era lenta). Si r = 1, lo que signifi- 
ca lAn-¡| = |A,], entonces es probable que la convergencia ni siquiera ocurra. Esto sucede 


(en el paquete sonoro) para un par conjugado complejo A, = A. Hay varias formas de 
evitar esta limitación. A continuación se describen tres. 


1. El método de potencias en bloque funciona con varios vectores a la vez, en lugar de 
Uj. S1 p vectores ortonormales se multiplican por A, y luego para ortogonalizarlos se 
aplica de nuevo el proceso de Gram-Schmidt —lo cual es un solo paso del método— 
entonces la razón de convergencia se convierte en r!' = |A,-,|/]An]. Se obtendrán 
aproximaciones para p valores característicos distintos y sus vectores característicos. 

2. El método de potencias inverso opera con A”? en vez de A. Un simple paso es Vy+1 = 
A7*y¿, lo cual significa que se resuelve el sistema AV¿+1 = Uy (¡y se ahorran los fac- 
tores L y U!) En este caso se converge al valor característico más pequeño A, y su vec- 
tor característico x,, en el supuesto de que JA,] < [A>2]. A menudo, lo que se requiere 
en las aplicaciones es A, y entonces la iteración inversa es una opción automática. 

3. El método de potencias inverso desplazado es el mejor de todos. A se sustituye por 
A — al. Cada valor característico es desplazado por «, y el factor de convergencia pa- 
ra el método inverso cambia a r” = lA; — a] /|A2 — a]. Si q; es una aproximación 
aceptable a A,, entonces r” es muy pequeño y la convergencia se acelera enormemen- 
te. Cada paso del método resuelve (A — a )Wi+; = wr: 

e A A E A 

ia. Ue = 0)" An ay 

Cuando « está próximo a A,, el primer término domina sólo al cabo de uno o dos pa- 

sos. Si A, ya se ha calculado con algún otro algoritmo (como OR), entonces « es este 


valor calculado. Un procedimiento normal es factorizar A — «al en LU y resolver 
Ux, = (1,1,..., 1) por sustitución hacia atrás. 


wi 


Si A, no se ha aproximado aún, entonces el método de potencias inverso desplazado 
debe generar su propia elección de a. Es posible hacer variar a = a, en cada paso si así se 
desea, de modo que A — A: )Wr+] = Wi. 





7.3 Cálculo de valores característicos 361 


Cuando A es simétrica, una opción bastante precisa es el cociente de Rayleigh: 


T 
Wi, ÁW; 
IS 
Wi Wi 


desplazado por o 


Este cociente R(x) tiene un mínimo en el vector característico verdadero x,. Su gráfica es 
como el fondo de una parábola, de modo que el error A; = (*, es aproximadamente el cua- 
drado del error del vector característico. Los factores de convergencia |A7 — 0%x|/|A2 — erz| 
en sí convergen a cero. Así, estos desplazamientos de cocientes de Rayleigh proporcionan 
una convergencia cúbica de Y, a Ai. 


Formas tridiagonales y de Hessenberg 


El método de potencias es razonable sólo para una matriz grande y rala. Cuando demasia- 
dos elementos son distintos de cero, este método es un error. En consecuencia, se plantea 
la pregunta de si existe alguna forma sencilla de crear ceros. Este es el objetivo de los pá- 
rrafos siguientes. 

Puede afirmarse que después de calcular una matriz semejante O”*A0 con más ceros 
que A, no se intenta regresar al método de potencias. Hay variantes mucho más poderosas, 
y parece que la mejor es el algoritmo OR. (El método de potencias inverso desplazado tie- 
ne su sitio al final, para encontrar el vector característico.) El primer paso es producir rápi- 
damente tantos ceros como sea posible, usando una matriz ortogonal O. Si A es simétrica, 
entonces también lo es O”*40. Ningún elemento puede hacerse peligrosamente grande 
porque Q preserva la longitud. 

Para pasar de A a O”!A0, hay dos posibilidades principales: Es posible producir un 
cero en cada paso (como en la eliminación), o puede trabajarse con toda una columna a la 
vez. Para un simple cero, es fácil utilizar una rotación del plano como se ilustra en la ecua- 
ción (7), que se encuentra cerca del final de esta sección, que tenga a cos O y sen Ó en un 
bloque de 2 por 2. Luego, puede ciclarse a través de todos los elementos por debajo de la 
diagonal, escogiendo en cada paso una rotación O que produzca un cero; este es el método 
de Jacobt. Fracasa en diagonalizar A después de un número finito de rotaciones, ya que los 
ceros de pasos previos se destruyen cuando se crean ceros posteriores. 

Para preservar los ceros y detenerse, es necesario plantear lo anterior para menos que 
una forma triangular. La forma de Hessenberg acepta una diagonal distinta de cero por 
abajo de la diagonal principal. Si una matriz de Hessenberg es simétrica, entonces sólo 
tiene tres diagonales distintas de cero. 

Una serie de rotaciones en los planos idóneos produce los ceros requeridos. Househol- 
der encontró una nueva manera de obtener exactamente lo mismo. Una transformación de 
Householder es una matriz reflexión, determinada por un vector v: 


uv: 


oir?” 


A menudo, v se normaliza para convertirlo en un vector unitario y = y/llv]]. y entonces A 
se transforma en Í — 2ux2. 


Matriz de Householder — Fl =]-2 


” Convergencia lineal significa que cada paso multiplica el error por un factor fijo r < 1. Convergen- 
cia cuadrática significa que en cada paso el error se eleva al cuadrado, como en el método de 20 
LON Xara — X= — f/f xp) para resolver f(x) = O. La convergencia cúbica requiere de 10" "a 
10 ato”? 
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En cualquier caso, HH es tanto simétrica como ortogonal: 





HH =(1 —-2uuYNU — 2uu?) =[ — 4uu* + 4uutuu” = 1. 


Así, H = H? = H”? El plan de Householder era producir ceros con estas matrices, y su 
éxito depende de la siguiente identidad Hx = —0z: 





La demostración consiste en calcular Hx y llegar a —0z: 


2uv*x Ux +O0Dx 
Y o O LISA e 
[wI1* de +ozJta +02) 
=x=(x +01) (porque xYx = a?) 
= —0Z. (Q) 


Esta identidad puede utilizarse de inmediato, sobre la primera columna de A. A la 
O” AO final le permite una diagonal diferente de cero abajo de la diagonal principal (for- 
ma de Hessenberg). En consecuencia, sólo participan los elementos que están estrictamen- 


te debajo de la diagonal: 
aa1 1 a: 
a 0 0 
a a , La eE Hx ss . A 6) 
Ant 0 0 


En este punto la matriz A de Householder es sólo de orden n — 1, de modo que está incrus- 
tada en la esquina inferior derecha de una matriz U, de tamaño completo: 


0 0 207 30 dq * o * ok ok 

0 —-O ko * : 
U,=|0 H =U/*, y UJAU,=| 0 x* xx. x« x 

0 O xx x= == 0% 

0 0 xx x 0. * 


Esta primera etapa está completa, y U,”*AU, tiene la primera columna requerida. En la se- 
gunda etapa, x consta de los n — 2 últimos elementos en la segunda columna (tres estrellas 
en negritas). Así, H, es de orden n — 2. Cuando está incrustada en U,, produce 


070 0 50 ko ok dk odo ok 
9 00:00 E E E 
U2=|0 0 =U>*, US (U¡"AU¡JU¿=|0 x*+ x*+ x= x= 
0 0 HL 00 xx x= 0h. 
0-0 00. x% +. 


Uy se encargará de la tercera columna. Para una matriz de 5 por 5, se alcanza la forma de 
Hessenberg (tiene seis ceros). Como regla general, O es el producto de todas las matrices 
UU, - + + U,, 2, y el número de operaciones necesarias para calcularla es de orden n?. 


| 
| 
| 
Ú 
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Ejemplo 2 (para cambiar a;3 = a3, en cero) 


1001 
A=|0 1 1|, == $. o= [il H= E 
E 10 


Al incrustar A en O, el resultado O” 40 es tridiagonal. 


10 0 l -1 0 
Ori O 10 SES. OTAQ=|-1 O. 1 
0 -1 0 0 1 1 


O” YAO es una matriz que ya está lista para revelar sus valores característicos: el algoritmo 
OR está listo para comenzar, aunque a continuación se hace una digresión para mencionar 
otras dos aplicaciones de estas mismas matrices H de Householder. 


1. 


La factorización de Gram-Schmidi A = OR. Recuerde que R ha de ser triangular su- 
perior. Ya no es necesario aceptar una diagonal distinta de cero extra abajo de la dia- 
gonal principal, ya que no hay matrices multiplicando por la derecha que estropeen los 
ceros. El primer paso en la construcción de O es trabajar con toda la primera columna 
de A: 


231 0 yu: 
; v=x-+!lxlliz, A, =I “PE 


an1 0 


La primera columna de A/A es igual a — llxllz. Es cero abajo de la diagonal principal, 
y es la primera columna de R. El segundo paso trabaja con la segunda columna de 
HA, desde el pivote hacia abajo, y produce una H,H,A que es cero abajo de ese pivo- 
te. (Todo el algoritmo es como la eliminación, aunque ligeramente más lento.) El re- 
sultado de n — 1 pasos es una matriz triangular superior R, aunque la matriz que 
registra los pasos no es una triangular inferior L. En vez de lo anterior, es el producto 
O = H;¡H,..- H,-, que puede almacenarse en esta forma factorizada (sólo se pre- 
servan los vs) y nunca se calcula explícitamente. Así se completa el proceso de Gram- 
Schmidt. 

La descomposición del valor singular UTAV = 2. La matriz diagonal * tiene la mis- 
ma forma que A, y sus elementos (los valores singulares) son las raíces cuadradas de 
los valores característicos de A*A. Debido a que las transformaciones de Househol- 
der sólo pueden preparar el problema de valores característicos, no es de esperar que 
produzcan 2. En vez de ello, producen de manera estable una matriz bidiagonal, con 
ceros en todas partes, excepto a lo largo de la diagonal principal y la diagonal arriba 
de ésta. 


El primer paso hacia la DVS es exactamente como en OR arriba: x es la primera co- 


lumna de A, y H,x es cero abajo del primer pivote. El paso siguiente es multiplicar por la 
derecha por una EW que produzca ceros, como se indica a lo largo del primer renglón: 


E > * * 0-0 
A>HA=|0 + x= *| > HAHY=]j0 x ==. «|. (4) 
O x= >. 3 0 x x* x 
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Luego, dos transformaciones de Householder alcanzan rápidamente la forma bidiagonal: 





* x* 0 0 * * 0 0 
HHAHO =l0 x * =* y HHABPEO =|10 »* x* 0 
0 E e DO x= «x 


El algoritmo OR para calcular valores característicos 


El algoritmo es casi mágicamente sencillo. Empieza con Ap, la factoriza en Q¿ Ry con el 
proceso de Gram-Schmidt, y luego invierte los factores: Ay = R¿Qo. La nueva matriz A, 
es semejante a la original porque O,* 4000 = 0, (Qo0Ro)Qo = A: Así, el proceso con- 
tinúa sin cambio en los valores característicos: 


Toda Az es igual Ark = QOxrRg  yentonces Ar = ReQrx. (5) 


Esta ecuación describe el algoritmo OR no desplazado, y casi siempre Ay tiende a una for- 
ma triangular. Sus elementos diagonales tienden a sus valores característicos, que también 
son los valores característicos de Ay. Si ya existía algún procesamiento para obtener la for- 
ma tridiagonal, entonces Ag está relacionada con la A absolutamente original, mediante 
O71AO = Ao. 

Como está, el algoritmo OR es bueno pero no tanto. Para hacerlo especial, requiere dos 
refinamientos: es necesario permitir desplazamientos a A; — Qgl, y debe asegurarse que la 
factorización OR en cada paso sea muy rápida. 


1. El algoritmo desplazado. Si el número q, está muy próximo de un valor caracte- 
rístico, el paso en la ecuación (3) debe desplazarse de inmediato por «, (lo cual cambia 


Qu y Ry): 
Ag 041 = QrRy yentonces — Ags = ReQu +Qul. (6) 


Esta matriz Az. | es semejante a A, (siempre los mismos valores característicos): 


Ox Ar Qé = OQ (QORe +0LD)Qr = Agr, - 


Lo que ocurre en la práctica es que el elemento (n, n) de Aj; el que está en la esquina infe- 
rior derecha, es el primero en tender a un valor característico. Ese elemento es la elección 
más simple y conocida para el desplazamiento (*;. Normalmente esto produce convergencia 
cuadrática, y en el caso simétrico incluso convergencia cúbica, al menor valor característi- 
co. Al cabo de tres o cuatro pasos del algoritmo desplazado, la matriz A, se ve como sigue: 


o COn EX 1: 





El A se acepta como una aproximación muy próxima al A, verdadero. Para encontrar el 
siguiente valor característico, el algoritmo OR continúa con la matriz más pequeña (de 3 
por 3, en la ilustración) en la esquina superior izquierda. Sus elementos subdiagonales se 
reducen algo en los primeros pasos OR, y otros dos pasos son suficientes para encontrar Az. 
Así se obtiene un procedimiento sistemático para encontrar todos los valores característi- 
cos. De hecho, el método OR ya está descrito por completo, Sólo queda encontrar los vec- 
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tores característicos, lo cual es un simple paso de potencias inverso, y usar los ceros crea- 
dos por Householder. 


2. Cuando A, es tridiagonal o de Hessenberg, cada paso QR es muy rápido. El proceso 
de Gram-Schmidt (factorización en OR) requiere O(n”) operaciones para una matriz com- 
pleta A. Para una matriz de Hessenberg, lo anterior se vuelve en O(n”), y para una matriz 
tridiagonal, es O(n). Por fortuna, cada nueva A, está nuevamente en forma de Hessenberg 
o tridiagonal: 


E 4 


>* 
O, es de Hessenberg Oo = ApRo” = y 


OD: + % 
X XA % 
Y XK E + 
OO +* 
O O* % 
X A + 


0 0 


Puede comprobarse fácilmente que esta multiplicación deja a Oy con los mismos tres ce- 
ros que Ay. Una matriz de Hessenberg multiplicada por una matriz triangular es una ma- 
triz de Hessenberg. Lo mismo es cierto para una matriz triangular multiplicada por una 
matriz de Hessenberg: 


E E E 
A, €s de Hessenberg Á1 = RoQo = : a d ñ e Ñ y ' 
0000 107 00d 


El caso simétrico es todavía mejor, ya que A; = Q¿*A.Qo = QT Ao Qo Permanece simé- 
trica. Por el razonamiento que acaba de presentarse, A, también es de Hessenberg. Así, Ay 
debe ser tridiagonal. Lo mismo es válido para Az, A3, . .., y cada paso OR empieza con 
una matriz tridiagonal. 

El último punto es la factorización en sí, que produce las O, y R; a partir de cada Az 
(o realmente, de Az — 0). Householder puede usarse de nuevo, pero es más sencillo aniqui- 
lar cada elemento subdiagonal a la vez, mediante una “rotación del plano” P,,. La primera 
es P 21: 


coso —sen0 dp * * * 

2 ea sen 9 cos 9 a * ok  * 
Rotación para eliminar a a,, Pa1Ax = 1 a A y E 

1 O 0 + 0 


-El elemento (2, 1) en este producto es a,, sen O + a,, cos 0, y se escoge el ángulo O que 
hace cero esta combinación. La siguiente rotación P3, se elige de forma semejante, para 
eliminar el elemento (3, 2) de P32P,¡A¿ Después de n — 1 rotaciones, se tiene Ro: 


Factor triangular Ry = Pa <<. Pz Pa Ar. (8) 
Más información acerca de este extraordinario algoritmo para cálculos científicos, puede 
encontrarse en libros sobre álgebra lineal numérica. Se menciona un método más: Arnoldi 
en ARPACK, para matrices grandes. Ortogonaliza la sucesión de Krilov x, Ax, 4%x,.....,me- 
diante el proceso de Gram-Schmidt. Si requiere los valores característicos de una matriz 
grande, ¡no use det(A — AD! 





Conjunto de problemas 7.3 


1. Parala matriz A = ls 2 , con valores característicos A, = 1 y 42 = 3, aplique tres 


£ . » ae 1 > £ 
veces el método de potencias uz, = Au, a la conjetura inicial uy = ES . ¿Cuál es el 
vector limitante 4..? 


| 





EU rn mi 
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2. Para la misma A y la conjetura inicial uy = [7], compare tres pasos de potencias in- 
versos con un paso desplazado con a: = ul Aug/utuy: 


l A ze 

ui FA E Ab ¿ O bien, u =(A —al) uo. 
q 0 

El vector limitante u.. ahora es un múltiplo del otro vector característico (1, 1). 


3. Explique por qué |A,/A »-1| controla la convergencia del método de potencias de cos- 
tumbre. Construya una matriz A para la que este método no converge. 


4. La matriz de Markov Á = de :2 tiene A = 1 y 0.6, y el método de potencias uz = 


A'uy converge a [835 ) Encuentre los vectores característicos de A”?. ¿A qué converge 
el método de potencias inverso u_¿ = A“*uy (después de multiplicar por 0.6%)? 


5. Demuestre que para dos vectores distintos de la misma longitud, [x]| = [yl], la trans- 
formación de Householder con Y = x — y proporciona Hx = y y Hy = x. 


6. Calcule y = |x|, v =x +0z, y H =1—2vv*/v*v. Compruebe Hx = —0x: 


lo 


7. Use el problema 6 para encontrar la H A H”* tridiagonal que es semejante a 


1.3.4 
A=13 1 0 
4.00 0 


8. Demuestre que empezando con Ay = Be ses ) el algoritmo OR sin desplazar sólo 
produce la modesta mejoría A; = : le eE 
9. Aplique a la siguiente matriz A un solo paso OR con el desplazamiento « = a,,, que 


en este caso significa sin desplazamiento, ya que a,, = O. Demuestre que los elemen- 
tos fuera de la diagonal van de sen 9 a —sen? O, que es convergencia cúbica. 


sen 0 0 





pS bi 6 sen o! 


10. Compruebe que el algoritmo QR no modifica la matriz tridiagonal A = E al Es uno 


de los (raros) contraejemplos de la convergencia (por lo que se desplaza). 


11. Demuestre por inducción que, sin desplazamientos, (0001: -* OMR -** R¡Ro) es 
exactamente la factorización OR de Aj. ¡ Esta identidad relaciona OR con el método de 
potencias y conduce a una explicación de su convergencia. Si [11] > [A2] > - ++ > [An], 


estos valores característicos aparecen gradualmente sobre la diagonal principal. 


12. Escoja sen O y cos O en la rotación P para triangularizar A, y encuentre R: 


¿eos 0. =sn0 111 LI 1% ej. 
paa = 55 sii P Ar | =R 
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13. Escoja sen Ó y cos Ó para hacer triangular a P,¡ A P,,* (misma A). ¿Cuáles son los va- 
lores característicos? 


14, Cuando Á se multiplica por P;, (rotación del plano), ¿qué elementos cambian? Cuan- 
do P,,se multiplica por la derecha por P,;*, ¿qué elementos cambian ahora? 


15. ¿Cuántas multiplicaciones y cuántas sumas se usan para calcular PA? (Una organiza- 
ción cuidadosa de todas las rotaciones proporciona ¿n” multiplicaciones y sumas, lo 
mismo que para OR por reflectores y el doble que para LU.) 


16. (Giro de una mano robot) Un robot produce cualquier rotación A de 3 por 3, a partir 
de rotaciones del plano alrededor de los ejes x, y, y z. Si P32P3¡P2¡A = [, las tres 
vueltas del robot están en 4 = P3¡! P3¡! P33!, Los tres ángulos son ángulos de Euler. 
Escoja la primera O de modo que 


cosó —sen8 0 1 a] zz Z 
P,¡ A = | sen0 cos8 0Ol|-— 2 —1 2 | es cero en la posición (2, 1) 
0 O A | 





7.4 MÉTODOS ITERATIVOS PARA Ax = bh 


En contraste con los valores característicos, para los cuales no hay opción, en absoluto se 
requiere un método iterativo para resolver Ax = b. La eliminación gaussiana llega a la so- 
lución x en un número finito de pasos (n?/3 para una matriz completa, menos para las gran- 
des matrices que se encuentran en realidad). Á menudo este número es razonable. Cuando 
es enorme, quizá convenga detenerse en una x fija que pueda obtenerse más rápido, y en- 
tonces ya no es de utilidad aplicar parcialmente la eliminación y luego detenerse. 

Nuestro objetivo es describir métodos que empiecen desde cualquier conjetura inicial 
Xq» Y Obtener una aproximación mejorada x;.. , a partir de la x, previa. Es posible detener- 
se donde se quiera. 

Es fácil inventar un método iterativo al separar la matriz A. Si A = S — T, entonces 
la ecuación Ax = bes la misma que Sx = Tx + b. En consecuencia, puede intentarse 


Iteración desde x, hasta Xz.+1 Sxg+r1 = Txp +b. (D) 


No hay garantía de que este método funcione. Una separación exitosa S — T satisface dos 
requisitos: 


1. El nuevo vector xz.. ¡ debe ser fácil de calcular. En consecuencia, S debe ser una ma- 
triz sencilla (¡e invertible!); puede ser diagonal o triangular. 

2. La sucesión x, debe converger a la solución verdadera x. Si la iteración en la ecuación 
(1) se resta de la ecuación verdadera Sx = Tx + b, el resultado es una fórmula que im- 
plica sólo los errores €, = x — Xg! 


Ecuación error Ser», = Tez. (2) 
Ésta es justo, una ecuación en diferencias. Empieza con el error inicial ey, y luego de 


k pasos produce el nuevo error 84 = (S”*T)“eo. La cuestión de convergencia es exac- 
tamente la misma que la cuestión de estabilidad: x, —> x exactamente cuando e, —> 0. 


A A A A NAAA RR 
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Recuerde que una solución típica de €x+1 = S”*Te, es una combinación de vectores ca- 
racterísticos: 


Error después de k pasos € =ciAjxi + *** + CaAiXp. (4) 


El mayor |A;¿| termina por ser dominante, de modo que el radio espectral p = JA. 4,| gobier- 
na la razón a la que e, converge a cero. Ciertamente, se requiere p < 1. 

Los requisitos 1 y 2 son contradictorios. Es posible alcanzar convergencia absoluta con 
S =A y T =0; el primer y único paso de la iteración debe ser Ax, = b. En ese caso la ma- 
triz error S”*T es cero, sus valores característicos y el radio espectral son cero, y la razón 
de convergencia (que suele definirse como —log p) es infinita. Pero Ax, = b puede ser di- 
fícil de resolver; ésa fue la razón para separar. A menudo una elección simple de $ puede 
ser exitosa, y se empieza con tres posibilidades: 





y 


Eon 
FIN 


ONO 


SN AAA nd) y 


1, $ = parte diagonal de A (método de Jacobi). 
2. $ = parte triangular de A (método de Gauss-Seidel). - 
3, S= combinación de 1 y 2 (sobrerrelajamiento sucesivo o SRS). ES 





S también se conoce como preacondicionador, y su elección es crucial en análisis numé- 
ricos. 


Ejemplo 1 (Jacobi) Aquí 'S es la parte diagonal de A: 


[2 -1 A Eo. Onil E pl. 
elias ral e. 


1 
2 


o 


Si las componentes de x son y y w, el paso de Jacobi Sxz,, = T xy + hb €s 


O 


b1/2 
DS Lab 


10 k ba /2 


Ni 


2v = Y: +b Y 
2W+1 = Vk +4 ba, w 
k+1 


SO 


ni 


La matriz decisiva S”*T tiene valores característicos +3, que significa que el error se re- 
duce a la mitad (un dígito binario más se vuelve correcto) a cada paso. En este ejemplo, 
que es demasiado pequeño para ser típico, la convergencia es rápida. 


Para una matriz A más grande, hay una dificultad muy práctica. La iteración de Ja- 
cobi requiere mantener todas las componentes de x, hasta que se ha completado el 
cálculo de xy. 1. Una idea mucho más natural, que sólo requiere la mitad de almacena- 
muento, €s empezar utilizando cada componente de la nueva xzg+, tan pronto como es 
calculada; xy, , toma el lugar de x, una componente a la vez. Entonces x, puede destruir- 
se en cuanto Xz.., es creada. La primera componente queda corno antes: 


Nueva x aylX)i+r = (412% — 413X3 — *** —AGinXnJke + br. 
1 








Ejemplo 2 
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El paso siguiente opera inmediatamente con este nuevo valor de x,, para encontrar (x>) eel 
Nuevaxz  %2(%2)1 = —021(%1)6+1 + (—473X3 — *** — anXnde + dba. 

Y la última ecuación en el paso de iteración usa exclusivamente nuevos valores: 
Nueva x, — GarlAnd+1 = (—0p1X] — Gp2X2 — *** — Gna1Xn-1)é+1 + Dn. 


Esto se denomuna método de Gauss-Seidel, aunque aparentemente Gauss no lo conocía y 
Seidel no lo recomendaba. Esto es parte de una historia sorprendente, ya que no es un mal 
método. Cuando los términos en x;, , se muevan al miembro izquierdo, S se ve como la par- 
te triangular inferior de A. En el miembro derecho, 7 es estrictamente triangular superior. 


(Gauss-Seidel) Aquí S”'T tiene valores característicos menores: 


2 f2 -1 O e o A 
a= | q s= |; 4. r=(0 0 > r= | 


Un simple paso del método de Gauss-Seidel lleva las componentes v, y w, en 


2841 = Wir + bh] , 2.0 de o 1 
bo o bien, e 4 Xk4] = k 54 xx +b. 


hina pj 
Eorecoreromnma 


Los valores característicos de S”*T son j y O. El error se divide entre 4 cada vez, de mo- 
do que un solo paso de Gauss-Seidel amerita dos pasos de Jacobi. Debido a que ambos 
métodos requieren el mismo número de operaciones —simplemente se utiliza el nuevo va- 
lor en vez del anterior, y realmente ahorra almacenamiento— el método de Gauss-Seidel 
es mucho mejor. 

Esta regla se cumple en muchas aplicaciones, aun cuando hay ejemplos en los que el 
método de Jacobi converge y Gauss-Seidel fracasa (o a la inversa). El caso simétrico es di- 
recto: cuando todos los a;; > O, Gauss-Seidel converge si y sólo si Á es positiva definida. 


Durante la época en que los cálculos se hacían manualmente se descubrió (tal vez acciden- 
talmente) que la convergencia es más rápida si se va más allá de la corrección Xy+1 — Xg 
de Gauss-Seidel. En términos generales, estas aproximaciones quedan en el mismo lado de 
la solución x. Un factor de sobrerrelajamiento «w nos acerca más a la solución. Con w = 
1, se recupera Gauss-Seidel; con w > 1, el método se conoce como sobrerrelajamiento su- 
cesivo (SRS). La elección óptima de w nunca es mayor que 2. A menudo está en la vecin- 
dad de 1.9. 

Para describir el sobrerrelajamiento, sean D, £, y U las partes de A sobre, abajo y arri- 
ba de la diagonal, respectivamente. (Esta separación no tiene nada que ver con la A = LDU 
de la eliminación. De hecho, ahora se tiene A = L + D + U.) El método de Jacobi tiene 
S = Den el miembro izquierdo y T = —L — U en el miembro derecho. El método de Gauss- 
Seidel escoge S = D + £ y T = —U. Para acelerar la convergencia, nos movemos a 


Sobrerrelajamiento DD + oLlara = 10 +0D — 0U ]xz + wb. iS) 


Sin importar w, la matriz de la izquierda es triangular inferior y la de la derecha es triangu- 
lar superior. En consecuencia, Xz.., puede seguir sustituyendo a xz, componente a compo- 


nente, tan pronto como es calculada. Un paso típico es 
Guild = ale + ola: x1 0 ++ Api XD TF (Xi 007 in Xd + bi) 





E A o 
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Ejemplo 3 


Si ocurre que la conjetura anterior x, coincide con la verdadera solución x, entonces la nue- 
va conjetura xz.. ; puede ser la misma, y la cantidad entre corchetes se elimina. 


(SRS) Para la misma A = E a | , cada paso de sobrerrelajamiento es 


25 70 _P24-0w) co 
es >| Ar+i = | 0 211 A + wb. 


Si se divide entre ww, estas dos matrices son S y Ten la separación A = S — T; la iteración 
regresa a Sxg+1 = Txg + b. La matriz crucial L = S” Tes 


ES AA) 0 A l=0w 30 
00 2 0 20) z0o(1=0w) 1-w+j30?|' 


La w óptima hace lo más pequeño posible al mayor valor característico de £ (su radio es- 
pectral). Todo el chiste del sobrerrelajamiento es descubrir esta «w óptima. El producto de 
los valores característicos es igual a det L = det T/det S: 


di42 =detL =(1 — w)?. 


Siempre det S = det D porque £ está abajo de la diagonal, y det T = det (1 — w)D porque 
U está arriba de la diagonal. Su producto es det £ = (1 — wm)”. (Esto explica por qué nun- 
ca se llega tan lejos como a w = 2. El producto de los valores característicos sería tan gran- 
de, y la iteración no convergería.) También se obtiene una pista sobre el comportamiento 
de los valores característicos: En la w óptima, los dos valores característicos son iguales. 
Ambos deben ser iguales a w — 1, de modo que su producto coincide con det L. Este valor 
de wes fácil de calcular, porque la suma de los valores característicos siempre coincide con 
la suma de los elementos diagonales (la traza de £): 


1 
«w óptima — 41 +42 = (0 — 1) + (Ojo — 1) = 2 — 20 + q Op (6) 


Esta ecuación cuadrática proporciona (Wjp = 4(2 — /3) = 1.07. Los dos valores caracte- 
rísticos iguales son aproximadamente w — 1 = 0.07, que es una reducción importante del 
valor de Gauss-Seidel A = + en w = 1, En este ejemplo, la elección correcta de w ha du- 
plicado nuevamente la razón de convergencia, ya que (1' = 0.07. Si w se incrementa aún 
más, los valores característicos se convierten en un par conjugado complejo, ya que ambos 
tienen |1| = w — 1, que ahora crece con ww. 


El descubrimiento de que tal mejoría podía obtenerse tan fácilmente, casi como por ar- 
te de magia, fue el punto de partida para 20 años de intensa actividad en análisis numérico. 
El primer problema fue resuelto en la tesis de Young de 1950: una simple fórmula para la w 
Óptima. El paso clave era relacionar los valores característicos A de L con los valores carac- 
terísticos u de la matriz original de Jacobi DT (—L — U. Esta relación se expresa como 


Fórmula paraw  (A+o0—1?=10*p?. (7) 


Lo anterior es válido para una amplia variedad de matrices de diferencias finitas, y si se to- 
ma «w = 1 (Gauss-Seidel), se obtiene 1? = 1 u?. En consecuencia, A =0 y A = ¿1? como 
en el ejemplo 2, donde ui = +5 yiA=0,4 = E Todas las matrices en la clase de Young 
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tienen valores cafidSMERCi, po qué AER Pares más-menos, y la A correspondiente 


son O y u?. Así, Gauss-Seidel duplica la razón de convergencia de Jacobi. 

El problema importante es escoger «w de modo que A.,,s, sea minimizado. Por fortuna, 
¡la ecuación de Young (7) es exactamente nuestro ejemplo de 2 por 2! La mejor w hace que 
ambas raíces A sean iguales a w — 1: 


EI 


- 
PA ma, da E , O e 

a. a EE da * - na. mm - 
no “e. 4 a OS e A 
Loro E =< AA, A es 


E E 
(o-D+(0o-1)=2-20+ uv, o bien, ae E 
m7 


Para una matriz grande, este patrón se repite para una cantidad de pares distintos +/4,, y 
sólo puede hacerse una elección de 1. La ¡e más grande proporciona el mayor valor de w 
y de lA = w — 1. Como el objetivo es hacer a Ama, lo más pequeño posible, ese par extre- 
mo satisface la mejor elección de Wgpr- 


Ss ARAYA E 
wóptima — We = a Y máx = W6n — 1. 
máx 


(8) 





Lo anterior sólo puede apreciarse con un ejemplo. Suponga que Á es de orden 21, lo 
cual es bastante moderado. Así, h = >» cos 1h = 0.99 y el método de Jacobi es lento; 
cos” 1h = 0.98 significa que incluso el método de Gauss-Seidel requiere muchas iteracio- 
nes. Pero como sen 1h = 40.02 = 0.14, el método de sobrerrelajamiento óptimo tendrá 
el factor de convergencia 


0.86 
Ae Ss O 5% 0.73, con WDépt 1 + Amáx = 1D 


El error se reduce en 25% en cada paso, y un solo paso SRS es el equivalente de 30 pasos 
de Jacobi: (0.99y" = 0.75. 

Este es un sorprendente resultado de una idea tan sencilla. Sus aplicaciones reales no 
son en un problema unidimensional como —u4, o = f. Un sistema tridiagonal Ax = hb ya es 
fácil. Para lo que es importante el sobrerrelajamiento (y otros conceptos) es para las ecua- 
ciones diferenciales. Al cambiar a —4xx — uyy = f'se llega al “esquema de cinco puntos”. 
Los elementos —1, 2, —1 en la dirección x se combinan con —1, 2, —1l en la dirección y 
para proporcionar una diagonal principal de +4 y cuatro elementos de —1 fuera de la dia- 
gonal. ¡La matriz A no tiene un ancho de banda pequeño! No hay ninguna forma para nu- 
merar los N? puntos de la malla en un cuadrado, de modo que cada punto permanezca 
próximo a sus cuatro vecinos. Esta es la verdadera dirección de la dimensionalidad, y 
computadoras en paralelo la alivian parcialmente. 


TTD PARAR 


1 
1 
! 
¡ 
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Si el ordenamiento se realiza renglón por renglón, cada punto debe esperar todo un 
renglón para que el vecino de arriba se aproxime. El ancho de banda de la “matriz de cin- 
co puntos” es N: 





N 


—1,2,—1lenz y y A 
da —1,-—1,4,-—1,-—1 


e 


Esta matriz ha recibido más atención, y ha sido atacada en más formas diferentes que cual- 
quier otra ecuación lineal Ax = b. La tendencia actual es volver a métodos directos, con 
base en una idea de Golub y Hockney: ciertas matrices especiales se apartarán cuando se 
aborden de la manera idónea. (Esto es comparable a la Transformada de Fourier Rápida.) 
Antes del surgimiento de los métodos iterativos de dirección alternada, donde la separa- 
ción dividía a la matriz tridiagonal en la dirección x y en la matriz en la dirección y. Una 
elección reciente es S = LgUy, donde elementos pequeños de las verdaderas L y U se igua- 
lan a cero mientras se factoriza A. Se denomina LU incompleta y puede ser terrible. 

No es posible terminar esta sección sin mencionar el método del gradiente conjugado, 
que parecía muerto aunque repentinamente resultó bastante vivo (los pasos se proporcio- 
nan en el problema 33). Es directo, más que iterativo, pero a diferencia de la eliminación, 
puede detenerse en cualquier parte del proceso. Y aunque no merece la pena mencionarlo, 
un concepto completamente nuevo puede surgir y ganar. Sin embargo, parece justo decir 
que fue el cambio de 0.99 a 0.75 lo que revolucionó la solución de Ax = b, 





ge Conjunto de problemas 7.4 
1. Los valores característicos de la siguiente matriz son 2— Y/2,2, y 2+wV2: 


a | 0 
A = |-1 2 el 
E, SS 


Encuentre la matriz de Jacobi DTK(—L — U) y la matriz de Gauss-Seidel (D + 
DT K—U) y sus valores característicos, así como los números Wópt Y Amaáx para SRS. 


2. Para la siguiente matriz de n por n, describa la matriz de Jacobi J = DTU—L — U): 


2 —1i 
=1 
A = E: 
== l iZ 
Demuestre que el vector x, = (sen 1h, sen 27ch, ..., sen ních) es un vector caracterís- 





tico de J con valor característico A, = cos rh = cos 2/(n + 1). 


3. Enel problema 2, demuestre que x, = (sen kxh, sen 2k1th, ..., sen nkrch) es un vec- Ed: 
tor característico de A. Multiplique x, por A para encontrar el valor característico co- E 
rrespondiente «Y, Compruebe que en el caso de 3 por 3 estos valores característicos | 
son 2 — A 22+3/2. 


Nota Los valores característicos de la matriz de Jacobi J = L(-L— U)=1— ¿A 
son A¿=1-— 50% = cos kzch. Ocurren en pares más-menos y Amax es cos Th.) 
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Los problemas 4 y 5 requieren el “teorema del círculo” de Gershgorin: Todo valor carac- 
terístico de Á está en por lo menos uno de los círculos Cy, ..., Ca, donde C, tiene su cen- 
tro en el elemento diagonal a; Su radio r, = a ¡si |ai¡| es igual a la suma absoluta a lo 
largo del resto del renglón. 


Demostración Suponga que x, es la mayor componente de x. Entonces Ax = Ax con- 
duce a 


a — ai)X; = Y aijXj, o bien, JA == a;;| < Sa, y 2 < > ai! = Fi. A 
¡Ai ¡ri ll 3 
4. La matriz 
IN A | 
A=J|0 4 1 
DAS 


Se denomina dominante diagonalmente porque toda |a¿;¡| > r;. Demuestre que cero no 
puede estar en ninguno de los círculos, y concluya que Á es no singular. 


5. Escriba la matriz de Jacobi J para la matriz A diagonalmente dominante del problema 
4, y encuentre los tres círculos de Gershgorin para J. Demuestre que todos los radios 
satisfacen 7, < 1, y que la iteración de Jacobi converge. 


6. La verdadera solución de Ax = b es ligeramente diferente de la solución por elimina- 
ción de LUxy = b; A — LU se pierde el cero debido al redondeo. Una estrategia es ha- 
cer todo en doble precisión, aunque una manera mejor y más rápida es el refinamiento 
iterativo: Calcula sólo un vector r = b — Axg en doble precisión, resuelva LUy = r, y 
sume la corrección y a xy. Problema: Multiplicar x, = xy + y por LU, escriba el resul- 
tado como una separación Sx, = Txgy + b, y explique por qué T' es extremadamente 
pequeña. Este simple paso lleva casi exactamente a x. 


7. Para una matriz general de 2 por 2 
a b 
era. 
encuentre la matriz de la iteración de Jacobi S7'T = —D"WL + U) y sus valores 
característicos 4, También encuentre la matriz de Gauss-Seidel —(D + L)7*U y sus 
valores característicos A;, y decida Si Amáx = Max: 
8. Cambie Ax = bax= (I — A)x + b. ¿Cuáles son S y T para esta separación? ¿Qué ma- 
triz S”*T controla la convergencia de Xx+1 = (1 — AJxy +b2? 
9. SiAoesun valor característico de A, entonces es un valor característico de 


B = [ — A. Los verdaderos valores característicos de B tienen valor absoluto menor 
que 1 si los verdaderos valores característicos de A están entre y 


10. Demuestre por qué la iteración Xx+1 = (1 — AJxx +Fb mo converge para 
_f2-1 
131 
11. ¿Por qué la norma de B* nunca es mayor que [B//*? Entonces ||B|| < 1 garantiza que 


las potencias de B* tienden a cero (convergencia). Esto no es una sorpresa, ya que |Al máx 
está debajo de [|Bl!. 
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12. Si A es singular, entonces deben fracasar todas las separaciones A = S — T. A partir 
de Ax = 0, demuestre que S”7*Tx = x. Por tanto, esta matriz B = ST tiened = 1 y 
fracasa. 


13. Cambie los 2s a 3s, y encuentre los valores característicos de S”*T por ambos méto- 
dos: 


a He 3:50 o 1] 
a) E > Xxi+41 A E o! xx+tb (GS) le o! ps o A ob. 
¿Alas para Gauss-Seidel es igual a |1/2,,, para Jacobi? 


14. Escriba un código de computadora (MATLAB u otro) para Gauss-Seidel. Puede de- 
finir S y T a partir de A, o establecer el ciclo iterativo directamente a partir de los 
elementos a, Pruébelo en —1, 2, —1 las matrices A de orden 10, 20, 50, con b = 3 
E 1 > 

15. La matriz de separación S para SRS es la misma que para Gauss-Seidel, excepto que a 
la diagonal se dividió entre «w. Escriba un programa para SRS de una matriz de n por 
n. Aplíquelo con w = 1, 1.4, 1.8, 2.2 cuando A es la matriz —1, 2, —1 de orden 10. 


16. Cuando A = A*, el método de Arnoldi-Lanczos encuentra gs ortonormales de modo a | 
que 4g; = b;-1q;-1 + a;9; + b;q;+1 (con q9 = 0). Multiplique por q? con la fina- E 
lidad de encontrar una fórmula para a, La ecuación indica que AQ = QT, donde Tes Z 
una matriz a 

17. ¿Cuál es la cota sobre [Al 4. proporcionada por Gershgorin para las siguientes matri- | SS ¡ 
ces (consulte el problema 4)? ¿Cuáles son los tres círculos de Gershgorin que contie- A 
nen a todos los valores característicos? A 

0303 10.2 a A Y 3 

A=j03 02 0.4 O o E A E e 

02 Uh 00d E ES Es 

La cuestión clave para matrices grandes, es que la multiplicación matriz-vector es a É 


mucho más rápida que la multiplicación matriz-matriz. Una construcción crucial em- 
pieza con un vector b y calcula Ab, Ab, .... (¡pero nunca A?!) Los N primeros vectores ge- 
neran el N-ésimo subespacio de Krilov. Se trata de las columnas de la matriz Ky de Krilov.: 


Ky=|[b Ab Ab ..- ANTID]. 


La iteración de Arnoldi-Lanczos ortogonaliza las columnas de Ky, y la iteración del gra- 
diente conjugado resuelve Ax = b cuando A es positiva definida simétrica. 


Iteración de Arnoldi Iteración del gradiente conjugado 17 
e = bi MD! Xo =0,70 =b, po ="0 E 3 
paran=laN—1 paran=1la N 38 
V=AÁ = (y1 A 1 
Gn a = (rai) / (pr_, Ap,-1) longitud del paso x,-¡ A Xp 
paraj=1lanH dE E O Y a aproxime la solución 
h in = qV Pa = Fai — On ÁPa-1 residuo nuevo b — Ax, 
v=v—hijng; == o a) mejora en este paso 
Paria == (UI Da = Ta Tr BaDai dirección de la siguiente búsqueda 


Gn+r = U/Rar+in Nota: Sólo 1 multiplicación matriz-vector Aq y Ap. 
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18. En Arnoldi, demuestre que g, es ortogonal a 9,. El método de Arnoldi es la ortogona- 
lización de Gram-Schmidt aplicada a la matriz de Krilov: Ky = OyRy. Los valores 
característicos de OLAOy a menudo se encuentran muy próximos a los de A, incluso 
para N < n. La iteración de Lanczos es el método de Arnoldi para matrices simétri- 
cas (todas codificadas en ARPACK). 


19. En gradientes conjugados, demuestre que r, es ortogonal a r, (residuos ortogonales), 
y plApy = 0 (las direcciones de búsqueda son A-ortogonales). La iteración resuelve 
Ax = b al minimizar el error eTAe en el subespacio de Krilov. Es un algoritmo fan- 
tástico. 
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E 8.1 DESIGUALDADES LINEALES 


El álgebra concierne ecuaciones, y a menudo el análisis concierne desigualdades. La línea 
entre ambos siempre ha parecido clara. Sin embargo, me he percatado que este capítulo es 
un contraejemplo: la programación lineal es sobre desigualdades, aunque constituye una 
parte incuestionable del álgebra lineal. También es extremadamente útil: es más probable 
que las decisiones de negocios impliquen programación lineal que determinantes o valores 
característicos. 

Hay tres formas para abordar las matemáticas subyacentes: intuitivamente a través de 
la geometría, computacionalmente a través del método simplex, o algebraicamente a través 
de la dualidad. Estos enfoques se desarrollan en las secciones 8.1, 8.2, y 8,3. Luego, la sec- 
ción 8.4 es sobre problemas (como el matrimonio) donde la solución es un entero. En la 
sección 8.5 se analizan el póquer y otros juegos matriciales. Los estudiantes del MIT en 
Bringing Down the House contaron cartas altas para ganar en blackjack (en Las Vegas se 
siguen reglas fijas, y un verdadero juego matricial implica estrategias al azar). 

En la sección 8.3 se presenta algo nuevo en esta cuarta edición. El método simplex 
ahora se presenta en franca competencia con una forma completamente nueva de hacer los 
cálculos, denominada método del punto interior. La emoción comenzó cuando Karmar- 
kar afirmó que su versión era 530 veces más rápida que el método simplex. (Su algoritmo, 
delineado en la sección 8.2, fue uno de los primeros que fueron patentados: algo que en- 
tonces creíamos imposible, y no realmente deseable.) Esa afirmación provocó una oleada 
de investigación sobre métodos que tienden a la solución desde el “interior”, donde todas 
las desigualdades son estrictas: x > O se convierte en x > O. El resultado es ahora una gran 
forma de obtener ayuda del problema dual para resolver el problema primario. 

Una clave para este capítulo es considerar los significados geométricos de las desi- 
gualdades lineales. Una desigualdad divide el espacio n-dimensional en un semiespacio 
donde se cumple la desigualdad, y en un subespacio en el que no lo hace. Un ejemplo típi- 
co es x + 2y > 4. La frontera entre los dos semiespacios es la recta x + 2y = 4, donde la 
desigualdad es “apretada”. La figura 8.1 se vería casi igual en tres dimensiones. La fronte- 
ra se convierte en un plano como x + 2y + z = 4, y arriba se encuentra el semiespacio 
x + 2y + z > 4. En n dimensiones, la “dimensión” del plano es n — 1. 








378 Capítulo 8 Programación lineal y teoría de juegos 





TIT CRIAS AAA 





+2y=0 


Figura 8.1 Las ecuaciones proporcionan rectas y planos. Las desigualdades, semiespacios. 


Hay otra restricción fundamental para la programación lineal: se requiere que x y y 
sean nonegativas. Este par de desigualdades x > 0 y y > O produce dos subespacios más. 
La figura 8.2 está acotada por los ejes coordenados: x > O admite todos los puntos a la de- 
recha de x = 0, y y > 0 es el subespacio que está arriba de y = 0. 


El conjunto factible y la función de costo 


El paso importante es imponer de una vez las tres desigualdades. Éstas se combinan para 
proporcionar la región sombreada de la figura 8.2. El conjunto factible es la intersección 
de los tres subespacios x + 2y > 4, x > 0, y y > 0. Un conjunto factible está constituido 
por las soluciones de una familia de desigualdades lineales como Ax > b (la intersección 
de m subespacios). Cuando también se requiere que toda componente de x sea no negativa 
(la desigualdad vectorial x > 0), se agregan n subespacios más. Mientras más restricciones 
se imponen, más pequeño es el espacio factible. 


Puede ocurrir fácilmente que un conjunto esté acotado o incluso sea vacío, Si el ejem- 
plo se cambia al subespacio x + 2y < 4, preservando x > 0 y y > O, se obtiene el pequeño 
triángulo OAB. Al combinar las dos desigualdades x + 2y > 4 y x + 2y < 4, el conjunto 
se reduce a una recta donde x + 2y = 4. Si se añade una restricción contradictoria como x 
+ 2y < —2, el conjunto factible es vacío. 


El álgebra de las desigualdades lineales (o conjuntos factibles) constituye una parte 
de nuestro tema de estudio. Sin embargo, la programación lineal tiene otros ingredientes: 
busca el punto factible que maximiza o minimiza una cierta función de costo como 2x + 
3y. El problema en programación lineal es encontrar el punto que está en el conjunto fac- 
tible y minimiza el costo. 


El problema se ilustra con la geometría de la figura 8.2. La familia de costos 2x + 3y 
proporciona una familia de rectas paralelas. El costo mínimo aparece cuando la primera 
recta corta al conjunto factible. Esta intersección ocurre en B, donde x” =0 y y” = 2; el 
costo mínimo es 2x" + 3y” = 6. El vector (0, 2) es factible porque está en el conjunto fac- 
tible, y es óptimo porque minimiza la función de costo, y el costo mínimo 6 es el valor del 
programa. Los vectores óptimos se denotan con un asterisco. 
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Figura 8.2 Conjunto factible con lados planos, y los costos 2x + 3y, que se tocan en B. 


El vector óptimo ocurre en un vértice del conjunto factible. Este hecho lo garantiza 
la geometría, ya que las rectas que proporcionan la función de costo (o los planos, cuando 
se llega a más incógnitas) se desplazan de manera continua hasta que cortan al conjunto 
factible. ¡El primer contacto debe ocurrir a lo largo de su frontera! El “método simplex” va 
de un vértice del conjunto factible al siguiente hasta que encuentra el vértice de menor cos- 
to. En contraste, los “métodos del punto interior” tienden a esa solución Óptima desde el 
interior del conjunto factible. 


Nota Con una función de costo distinta, la intersección podría no ser un solo punto. Si el 
costo fuese x + 2y, toda la arista entre B y A sería Óptima. El costo mínimo es x" + 2y”, 
que es igual a 4 para todos estos vectores óptimos. En nuestro conjunto factible, ¡el proble- 
ma máximo no tendría solución! El costo podría elevarse arbitrariamente y el costo máxi- 
mo sería infinito. 

Todo problema de programación lineal puede ubicarse en cualquiera de las tres cate- 
gorías posibles siguientes: 


1. El conjunto factible es vacío. 

2. La función de costo no está acotada en el conjunto factible. 

3. El costo alcanza su mínimo (o máximo) en el conjunto factible: este es el caso bonda- 
doso. 


Los casos vacío y no acotado son bastante raros para un problema genuino en economía o 
ingeniería. Se espera una solución. 


Variables flojas 


Hay una forma simple para cambiar la desigualdad x + 2y > 4 en una ecuación. Simple- 
mente se introduce la diferencia como una variable floja w = x + 2y — 4. ¡Esta es nues- 
tra ecuación! La restricción anterior x + 2y > 4 se convierte en w > O, lo cual coincide 
perfectamente con las otras restricciones de la desigualdad x > 0, y > 0. Así, se tienen só- 
lo ecuaciones y simples restricciones de no negatividad sobre x, y, w. Las variables w que 
““quitan la flojera” ahora se incluyen en el vector incógnito x: 


Problema original Minimizar cx sujeto a Ax = b y x > 0. 


El vector renglón c contiene los costos; en nuestro ejemplo, c = [2 3 0]. La condición x 
> O pone el problema en la parte no negativa de R”. Estas desigualdades se reducen a las 
soluciones de Ax = b. La eliminación corre peligro, por lo que se requiere una idea com- 
pletamente nueva. 
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El problema de la dieta y su dual 


Nuestro ejemplo con costo 2x + 3y puede plantearse con palabras. llustra el “problema de 
la dieta” en programación lineal, con dos fuentes de proteínas, por ejemplo, un bistec y 
mantequilla de cacahuate. Cada libra de mantequilla de cacahuate proporciona una unidad 
de proteínas, y cada bistec proporciona dos unidades. En la dieta se requieren por lo me- 
nos dos unidades de proteínas. Por tanto, una dieta que contiene x libras de mantequilla de 
cacahuate y y bisteces está restringida por x + 2y > 4, así como por x > 0 y y > 0. (No 
puede tenerse un bistec o mantequilla de cacahuate negativos.) Este es el conjunto factible, 
y el problema es minimizar el costo. Si una libra de mantequilla de cacahuate cuesta $2 y 
un bistec cuesta $3, entonces el costo de toda la dieta es 2x + 3y. Por fortuna, la dieta óp- 
tima consta de dos bisteces: 1" = 0 y y” = 2. 

Todo programa lineal, incluyendo éste, tiene un dual. Si el problema original es una 
minimización, su dual es una maximización. El mínimo en el “problema original” dado, 
es igual al máximo en su dual. Esta es la clave de la programación lineal, que se explica- 
rá en la sección 8.3, Aquí se permanece con el problema de la dieta y se intenta interpretar 
su dual. 

En lugar del comprador, quien compra suficientes proteínas al costo mínimo, el pro- 
blema dual es confrontado por el farmacéutico. Las píldoras de proteínas compiten con los 
bisteces y con la mantequilla de cacahuate. De inmediato se encuentran los dos ingredien- 
tes de un programa lineal típico: el farmacéutico maximiza el precio p de las píldoras, aun- 
que este precio está sujeto a restricciones lineales. Las proteínas sintéticas no deben costar 
más que las proteínas que hay en la mantequilla de cacahuate ($2 por unidad) o las proteí- 
nas que hay en los bisteces ($3 por dos unidades). El precio debe ser no negativo o el far- 
macéutico no venderá nada. Debido a que se requieren cuatro unidades de proteínas, la 
ganancia del farmacéutico es de 4p: 


Problema dual Maximizar 4p, sujeto ap <2,2p <3yp> 0. 


En este ejemplo es más fácil resolver el dual que el original; sólo tiene una incógnita p. La 
restricción 2p < 3 es la estricta que en realidad es activa, y el precio máximo de la proteí- 
na sintética es p = $1.50. La ganancia máxima es 4p = $6, y el comprador termina pagan- 
do lo mismo por la proteína natural que por la proteína sintética. Este es el teorema de 
dualidad: el máximo es igual al mínimo. 


Aplicaciones típicas 


La siguiente sección se concentra en la resolución de programas lineales. Este es el mo- 
mento para describir dos situaciones prácticas en las que se minimiza o maximiza una fun- 
ción de costo lineal sujeta a restricciones lineales. 


1. Planeación de la producción. Suponga que la General Motors gana $200 por cada 
Chevrolet, $300 por cada Buick y $500 por cada Cadillac. Estos automóviles dan 20, 17, 
y 14 millas por galón, respectivamente, y el Congreso insiste en que el automóvil prome- 
dio debe proporcionar 18. La planta puede ensamblar un Chevrolet en un minuto, un Buick 
en dos minutos, y un Cadillac en 3 minutos. ¿Cuál es la ganancia máxima en 3 horas (480 
minutos)? 


Problema Maximizar la ganancia 200x + 300y + 500z sujeta a 


Al A 2 ARE LOZA OA O 
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2. Selección del portafolios. Los bonos federales pagan 5%; los municipales, 6%, y los 
bonos chatarra, 9%. Es posible comprar cantidades x, y, z sin exceder un total de $100 000. 
El problema consiste en maximizar el interés, con dos restricciones: 


i) noes posible invertir más de $20 000 en bonos chatarra, y 
11) la calidad media del portafolios no debe ser menor que los bonos municipales, de mo- 
do que x > z. 


Problema Maximizar 5x + 6y + 9z sujeto a 
HEY TZS 1000007 2220000... 2% M2 >0. 


Las tres desigualdades proporcionan tres variables flojas, con nuevas ecuaciones como 
w <= x — z y desigualdades w > 0. 


Conjunto de problemas 8.1 


1. Trace el conjunto factible con restricciones x + 2y > 6,2x + y > 6,x > 0, y > O. 
¿Qué puntos están en los tres “vértices” de este conjunto? 


2. (Recomendado) Sobre el conjunto factible precedente, ¿cuál es el valor mínimo de la 
función de costo x + y? Trace la recta x + y = constante que toca primero el conjun- 
to factible. ¿Qué puntos minimizan las funciones de costo 3x + y y x — y? 


3. Demuestre que el conjunto factible restringido por 2x + 3y < 3, —3x +8y < —S, 
x > 0, y > 0, es vacío. 


4. Demuestre que el siguiente problema es factible pero no acotado, de modo que no 
tiene solución óptima: Maximizar x + y, sujeto a x > 0, y > 0, —3x +2y<-—l, 
RAS 


S. Agregue una simple desigualdad restrictiva a x > 0, y > O de modo que el conjunto 
factible contenga sólo un punto. 


6. ¿Qué forma tiene el conjunto factible x >0,y>0,z2>0,x+yw+z=l, y cuál es 
el máximo de x + 2y + 3z? 


7.  Resuelva el problema del portafolios al final de la sección precedente. 


8. Enel conjunto factible para el problema de la General Motors, la no negatividad x, y, 
z >. 0 deja un octavo del espacio tridimensional (el octante positivo). ¿Cómo es corta- 
do esto por los dos planos de las restricciones, y qué forma tiene el conjunto factible? 
¿Cómo muestran sus vértices que, con sólo estas dos restricciones, sólo hay dos tipos 
de automóviles en la solución óptima? 


9. (Problema de transporte) Suponga que Texas, California, y Alaska producen —cada 
uno— un millón de barriles de petróleo; en Chicago se requieren 800 000 barriles, a 
una distancia de 1000, 2000, y 3000 millas de los tres productores, respectivamente; y 
se necesitan 2 200 000 barriles en Nueva Inglaterra a 1500, 3000, y 3700 millas de dis- 
tancia. Si el embarque cuesta una unidad por cada barril-milla, ¿qué programa lineal 
con cinco restricciones de igualdad debe resolverse con la finalidad de minimizar el 
costo por embarque? 
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ES 8.2 EL MÉTODO SIMPLEX 


Esta sección aborda la programación lineal con n incógnitas x > O y m restricciones Ax > 
b. En la sección previa se tenían dos variables, y una restricción x + 2y > 4. No es difícil 
explicar todo el problema, pero no es fácil resolverlo. 

El mejor método es plantear el problema en forma matricial. Se cuenta con A, b, y c: 


1. una matriz A de m por n, 
2. un vector columna b con m componentes, y 
3. un vector renglón c (vector de costo) con n componentes. 


Para ser “factible”, el vector x debe satisfacer x > O y Ax > b. El vector óptimo x' es el vec- 
tor factible de costo mínimo, y el costo es cx =C1x1 + *** + CrXn. 


Problema mínimo Minimizar el costo cx, sujeto ax > 0 y Ax > b. 


La condición x > O restringe a x al cuadrante positivo en el espacio n-dimensional. En 
R? es un cuarto del plano; es un octavo de R”. Un vector aleatorio tiene una posibilidad en 
2” de ser no negativo. Ax > b produce m semiespacios adicionales, y los vectores factibles 
satisfacen todas las m + n condiciones. En otras palabras, x está en la intersección de m + n 
semiespacios. Este conjunto factible tiene lados planos; puede no estar acotado y ser vacío. 

La función de costo cx aporta al problema una familia de planos paralelos. Un plano 
cx = 0 pasa por el origen. Los planos cx = constante proporcionan todos los costos posi- 
bles. A medida que varía el costo, estos planos barren todo el espacio n-dimensional. La pa 
óptima (el menor costo) ocurre en el punto en que los planos tocan por vez primera al con- 
Junto factible. 

Nuestro objetivo es calcular x”. Esto puede hacerse (en principio) encontrando todos 
los vértices del conjunto factible, y calculando sus costos. En la práctica esto es imposible. 
Podría haber millones de vértices, por lo que sería imposible calcularlos todos. En vez de 
hacer lo anterior, se aplica el método simplex, que es uno de los conceptos más célebres en 
matemáticas computacionales. Este método fue desarrollado por Dantzig como una forma 
sistemática para resolver programas lineales, y ya sea por suerte o no, se trata de un éxito 
sorprendente. Los pasos del método simplex se resumirán en breve, ya que primero se in- 
tentará explicarlos. 


La geometría: movimiento a lo largo de las aristas 


Considero que lo que revela el método es la explicación geométrica. En la fase 1 simple- 
mente se localiza un vértice del conjunto factible. El meollo del método va de vértice a vér- 
ice a lo largo de las aristas del conjunto factible. En un vértice típico hay n aristas a 
escoger. Algunas aristas se alejan de la x" óptima pero desconocida, y otras llevan gradual- 
mente hacia ésta. Dantzig escogió una arista que lleva a un nuevo vértice con un costo me- 
nor. No hay posibilidad de volver a nada que sea más costoso. Finalmente se llega a un 
vértice especial, a partir del cual todas las aristas conducen al camino equivocado: se ha 
minimizado el costo. Este vértice es el vector Óptimo x”, y ahí se detiene el método. 

El siguiente problema es transformar los conceptos de vértice y arista en álgebra li- 
neal. Una arista es el punto de encuentro de n planos distintos. Cada plano está dado 
por una ecuación —-Justo como tres planos (muro frontal, muro lateral, y piso) producen un 
vértice en tres dimensiones. Cada vértice del plano factible proviene de transformar n de 
las n + m desigualdades Ax > b y x > 0 en ecuaciones, y encontrar la intersección de es- 
tos q planos. 
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Una posibilidad es escoger las » ecuaciones x, = 0,...,x, = 0, y terminar en el orj- 
gen. Así como todas las demás posibilidades, este punto de intersección sólo es un vértice 
genuino si también satisface las demás m restricciones de desigualdad. En caso contrario, 
ni siquiera está en el conjunto factible, por lo que es un engaño total. Nuestro ejemplo con 
n = 2 variables y m = 2 restricciones tiene seis intersecciones, que se ilustran en la figura 
8.3. Tres de ellas en realidad son los vértices P, O, R del conjunto factible. Se trata de los vec- 
tores (0, 6), (2, 2) y (6, 0). Uno de ellos debe ser el vector óptimo (a menos que el costo mí- 
nimo sea —00). Los otros tres, incluyendo el origen, son falsos. 


Pa Qe E Í 1 Y 7 a 
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Figura 8.3 Los vértices P, O, R y las aristas del conjunto factible. 


En general, hay (n + m)! Ze n!m! intersecciones posibles. Esto incluye el número de for- 
mas para elegir n ecuaciones planas de n + m. El tamaño de este coeficiente binomial ha- 
ce imposible el cálculo de todos los vértices para m y n grandes. La tarea de la Fase l es 
encontrar un vértice genuino o establecer que el conjunto factible es vacío. Continuamos 
con la hipótesis de que se ha encontrado un vértice. 

Suponga que se retira uno de los » planos de intersección. Los puntos que satisfacen 
las n — 1 ecuaciones restantes constituyen una arista que sale del vértice. Este vértice 
es la intersección de los n — 1 planos. Para permanecer en el conjunto factible, a lo largo 
de cada arista sólo se permite una dirección. Pero se tiene una elección de n aristas, y la Fa- 
se II debe hacer esta elección. 

Para describir esta fase, Ax > b vuelve a escribirse en una forma completamente para- 
lela a las n restricciones simples x, > 0. Este es el papel de las variables flojas w = Ax — 
b. Las restricciones Ax > b se traducen a w, >0,...,w,, > 0, con una variable floja pa- 
ra cada renglón de A. La ecuación w = Ax — b,0 Ax — w = b, pasa a la forma matricial: 


Las variables flojas proporcionan m ecuaciones [A —7] li =b, 


El conjunto factible está regido por estas m ecuaciones y las n + m desigualdades simples 
x > 0, w > 0. Ahora se cuenta con restricciones de igualdad y nonegatividad. 

El método simplex no establece ninguna diferencia entre x y w, de modo que se sim- 
plifica: 


[A Pl se vuelve a be se vuelve a ] se vuelve a 


nombrar como Á wi nombrar como x nombrar como c. 
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Ejemplo 1 


Ejemplo 2 


Las restricciones de igualdad son ahora Ax = b. Las n + m desigualdades se vuelven 
justo x > O. El único rastro que queda de la variable floja w se encuentra en el hecho de 
que la nueva matriz A es de m por n + m, y la nueva x tiene n + m coraponentes. Se pre- 
serva mucho de la notación original, dejando sin cambio a m y n como recordatorio de lo 
que ha ocurrido. El problema ha cambiado a: Minimizar cx, sujeto a x > 0 y Ax = b. 


El problema en la figura 8.3 tiene las restricciones x +2y > 6,2x + y > 6, y costo x + y. 
El nuevo sistema tiene cuatro incógnitas (x, y, y dos variables flojas): 


E E _ 16 pe 
A= |) A x o= 5 cell TOOL 


El algoritmo simplex 


Con restricciones de igualdad, el método simplex puede comenzar. Un vértice es ahora un 
punto donde n componentes del nuevo vector x (los x y w anteriores) son cero. Estas n 
componentes de x son las variables libres en Ax = b. Las m componentes restantes son las 
variables básicas o variables pivote. Al igualar a cero las 1 variables libres, las m ecuacio- 
nes Ax = bh determinan las m variables básicas. Esta ““solución básica” x es un vértice ge- 
nuino si sus m1 componentes distintas de cero son positivas. Así, x pertenece al conjunto 
factible. 





El punto vértice P en la figura 3.3 es la intersección de x = O con 2x + y —6=0, 


Ed » 0 
Vértice (0, 6, 6, 0) 
Básica (dos ceros) Ax = | ¿ E > E ; = A = 
Factible (positivos diferentes de cero) 2 l A Ñ 


¿A cuál vértice ir a continuación? Se requiere moverse a lo largo de una arista hacia 
un vértice adyacente. Debido a que los dos vértices son vecinos, m — 1 variables básicas 
permanecen siendo básicas. Sólo uno de los 6s se vuelve libre (cero). Al mismo tiempo, 
una variable se mueve desde cero para convertirse en básica. Las otras m — 1 compo- 
nentes básicas (en este caso, los otros 6) cambian pero siguen siendo positivas. La elec- 
ción de arista (consulte el ejemplo 2 a continuación) decide qué variable sale de la base y 
cuál entra. Las variables básicas se calculan al resolver Ax = b. Las componentes libres 
de x se igualan a cero. 


Una variable que entra y una variable que sale producen un desplazamiento hacia un nue- 


vo vértice, 
EN a X1 + Az TF Óxa E Zxs = 8 
Minimizar Ta = Xa 3x5 sujeto a 
X2 + X3 E 3x5 = 9, 


Se empieza desde el vértice en que x, = 8 y x, = 9 son las variables básicas. En ese vér- 
tice, xy = xy = x5 = 0. Esto es factible, aunque el costo puede no ser el mínimo. Sería im- 
prudente hacer positivo a x3, ya que su coeficiente de costo es +7 y se está tratando de 
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minimizar el costo. Se escoge x5 porque tiene el coeficiente de costo más negativo: —3. La 
variable de entrada es xs, 

Con x; que entra a la base, deben salir x, o xz. En la primera ecuación, xs se incremen- 
ta y x, se disminuye mientras se mantiene x, + 2x5 = 8. Luego, x, se lleva hasta cero cuan- 
do xs llega a 4. En la segunda ecuación se mantiene x2 + 3x5 = 9. Aquí x5 sólo puede crecer 
hasta 3. Ir más allá haría negativo a x,, de modo que la variable de salida es x». El nuevo 
vértice tiene x = (2, 0, 0, 0, 3). El costo ha bajado a —9. 


Forma rápida EnAx= E los miembros derechos SS entre los coeficientes de la va- 
riable de entrada son £ 5 2. La razón más pequeña, 2 indica cuál es la variable que llega 
primero a cero, por lo que debe salir. Sólo se consideran razones positivas, porque si el coe- 
ficiente de xs fuese —3, entonces incrementar xs en realidad haría crecer a x2. (En x5 = 10, 
la segunda ecuación daría x, = 39.) La razón 3 indica que la segunda variable sale. Tara- 
bién proporciona x5 = 3. 

Si todos los coeficientes de x5 hubieran sido negativos, se tendría un caso no acotado: 
es posible hacer arbitrariamente grande a xs, y disminuir el costo hacia —00. 

El paso actual termina en el nuevo vértice x = (2, 0, O, O, 3). El paso siguiente es fá- 
cil sólo si las variables básicas x, y xz se mantienen por sí mismas (como originalmente fue 
el caso con x, y x2). En consecuencia, se “pivotea” sustituyendo xs = (9 —% =)ep1la 
función de costo y en la primera ecuación. El nuevo problema, empezando desde el nuevo 
vértice, es: 


Minimizar el costo 7x3 — X4 (9 —x2 =x3) = x2 + 8x3 —x4 9 
ieci 2 e 
con restricciones x= dx + lí + 6x4 y 
3X2 A 3X3 + xs = 3. 


El paso siguiente es fácil ahora. El único e negativo —1 en el costo hace que la 
variable de entrada sea x4. Las razones de ¿ y 2, los miembros derechos divididos entre 
la columna de x4, hace que x, sea la variable de salida, El nuevo vértice es x” = (0, 0, 0, ! 33 
3). El nuevo costo —93 es el mínimo. 


En un problema grande, una variable de salida puede volver a entrar a la base después. 
Pero el costo sigue bajando ——excepto en un caso degenerado— de modo que las m varia- 
bles básicas no pueden ser las mismas de antes. ¡Ningún vértice se visita dos veces! El mé- 
todo simplex debe terminar en el vértice Óptimo (o en —oo si ocurre que el costo no está 
acotado). Lo extraordinario es la rapidez con que se encuentre x”. 


Resumen Los coeficientes de costo 7, —1, —3 en el primer vértice y 1, 8, —1 en el se- 
gundo vértice decidieron las variables de entrada. (Estos números van en r, el vector cru- 
cial que se define a continuación. El método se detiene cuando todos son positivos). Las 
razones decidieron las variables de salida. 


Observación sobre la degeneración Un vértice es degenerado si más de las n componen- 
tes de costumbre de x son cero. Por el vértice pasan más de n planos, de modo que ocurre 
que una variable básica se hace cero. Las razones que determinan la variable de salida in- 
cluyen ceros, y la base podría cambiar sin realmente moverse del vértice. Teóricamente, es 
posible permanecer en un vértice y dar vueltas por siempre en la elección de la base. 

Por fortuna, esta situación no ocurre. Es tan rara que los códigos comerciales la igno- 
ran. Lamentablemente, los casos degenerados son bastante comunes en aplicaciones: si el 
costo se imprime después de cada paso simplex, se observa que se repite varias veces an- 
tes de que el método simplex encuentre un buen vértice. Luego, el costo decrece otra vez. 
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La tabla (tableau) 


Cada paso simplex implica decisiones seguidas por operaciones en los renglones -——es ne- 
cesario escoger a las variables de entrada y de salida, y es necesario hacer que vayan y vuel- 
van. Una forma de organizar el paso es escribir A, b, c en una matriz grande, o tabla: 


La tabla es de m + 1lpom+n+l T-= jo e 


E O 
Al inicio, las variables básicas pueden mezclarse con las variables libres. Volviendo a nume- 
rar en caso de ser necesario, suponga que Xy, ... , X,n son las variables básicas (distintas de 


cero) en el vértice actual. Las m primeras columnas de A forman una matriz cuadrada B (la 
matriz base para ese vértice). Las n últimas columnas proporcionan una matriz N de m por 
n. El vector de costo se separa en [cg cy], y la incógnita x lo hace en (Xp, Xp). 

En el vértice, las variables libres son xy = 0. Ahí, Ax = b se convierte en Bxg = b: 


Tabla en el vértice T= bare] xn =0 xg = B"!b costo =cpB"'b. 


Tabla reducida TU = |--.-- promos porro , 


Para alcanzar la forma escalonada totalmente reducida R = rref(T), cg multiplicado por 
el renglón en bloque superior se resta del renglón inferior: 


a) 
il 


Totalmente reducida 


Ú 
, 
! 
1 
ARA AAA AAA AAA PYR... «a. mmm. “oq 
1 
! 
! 
3 


Oicey=cgB NN 


A continuación se revisará el significado de cada elemento de esta tabla, y se llama la aten- 
ción hacia el ejemplo 3 (a continuación, con números). He aquí el álgebra: 


Restricciones xp + B"*Nxy = Bb Vértice xp =B"!b, xy =0. (1) 
El costo cgxg + CyXy se ha convertido en 
Costo cx =(cy —caB  N)xy +cgB"!b Costo en este vértice = cgB"'b, (2) 


Toda cantidad importante aparece en la tabla completamente reducida R. Es posible deci- 
dir si el vértice es óptimo al observar ar = cy — cgB7*N en medio del renglón inferior. Si 
cualquier elemento en r es negativo, sigue siendo posible reducir el costo. Es posible 
hacer negativo a rxyy, al principio de la ecuación (2), incrementando una componente de xy. 
Este es el paso siguiente. Pero sí r > O, entonces se ha encontrado el mejor vértice. Esta es 
la pagera de detención, o condición de a 


0 88: a El dá es s óptitno cua y r = e o o pE =p : > 0. dr costo. es SB 1, Es 
] Las componentes negativas de r. corresponden ¿ á aristas en las cuales el costo dismi-. 3 
N $, La variable: X; ¡ Corresponde « a la a componente n más is negativa de r. 


















Las componentes ESSE de r son los costos reducidos: el costo en cy por usar una 
variable menos lo que ahorra. El cálculo de r se denomina poner precio a las variables. Si 
el costo directo (en cy) es menor que el ahorro (de reducir las variables básicas), entonces 
r¿< 0, y pagará por incrementar esa variable básica. 
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Suponga que el costo reducido más negativo es r, Entonces, la :-ésima componente de XN 
es la variable de entrada, que crece desde cero hasta un valor positivo « en el vértice si- 
guiente (el final de la arista). 

A medida que se incrementa x,, Otras componentes de x pueden decrecer (para mante- 
ner Ax = b). La primera x, que llega a cero se convierte en la variable de salida: cambia de 
básica a libre. El siguiente vértice se alcanza cuando una componente de xg cae a cero. 

El nuevo vértice es factible porque sigue teniéndose x > O. Es básico porque de nuevo 
se tienen n componentes cero. La ¡-ésima componente de xy pasó de cero a «r. La k-ésima 
componente de xg cayó a cero (las otras componentes de xg siguen siendo positivas). La xy 
de salida que cae a cero es la que proporciona la razón mínima en la ecuación (3): 





Mn 


! > 80: ¡Suponga que y X ¿es s la variable de entrada y que u es sla columna i de No ee 


2 E AS BB (Bb) die 
REO En el. nu yO vértice. A = q = razón más ueña ——m————e% 
ito réxdes A 





A SE 
EN us y 
A y 1 
CA e ADA 
A 
A SS 
ATA : 
1 MN 
A My 





Este mínimo ido se toma a sobre componentes positivas de sn 7 La k.esima cólum- A 
na, ¿de B sale de la base Gu se, vuelve cero) y entra, la nueya olunana l. | 





B7*u es la columna de B7'N en la tabla reducida R, arriba del elemento más negativo en 
el renglón inferior r. Si B7*u <O, el siguiente vértice está infinitamente lejos y el costo mí- 
nimo es —o0 (esto no ocurre aquí). Nuestro ejemplo va del vértice P a O, y de nuevo em- 
pieza en Q. 


Ejemplo 3 La función de costo original x + y y las restricciones Ax = b = (6, 6) proporcionan 


E E, JS 
2-12 ES 3 E 
E E A: A A 

O A aca 


En el vértice P en la figura 8.3, x = O corta a 2x + y = 6. Para estar organizados, se inter- 
cambian las columnas 1 y 3 con la finalidad de escribir las variables básicas antes que las 
variables libres: 


e E A: 
Tabla en P T= O E E a EE 
1: Or. Y 


Luego, la eliminación multiplica el primer renglón por —1, para obtener un pivote unita- 
rio, y usa el segundo renglón para producir ceros en la segunda columna: 


A A 
Totalmente reducidaenP.— R=| 0 1; a E E 
0 05 —1 ¡A 


Primero observe a r = [-1 1] en el renglón inferior. Tiene un elemento negativo en la co- 
lumna 3, de modo que la tercera variable entra a la base. El vértice le P y su costo +6 
no son óptimos. La columna il de ese elemento negativo es B"*u = (3, 2); sus razo- 
nes con la última columna son : Yo c. Debido a que la primera razón es menor, la primera 
incógnita w (y la primera columna de la tabla) es obligada a abandonar la base. En la figu- 
ra 8.3, se efectúa un movimiento a lo largo del conjunto factible del vértice P al vértice Q. 
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La nueva tabla intercambia las columnas 1 y 3, y al pivotear por eliminación se ob- 


tiene 
: ; 1 eN A 
; 2 E: 
Me Te o a oe 
1.0" 0 1 -6 A E 


En esa nueva tabla en Q,r = [3 3]es positivo. Se ha pasado la prueba de deten- 


ción. El vértice x = y = 2 y su costo +4 son óptimos. 


Organización de un paso simplex 


A continuación, la geometría del método simplex se representa en álgebra: Los “vértices” 
son “soluciones factibles básicas”. El vector r y la razón « son decisivos. Su cálculo cons- 
tituye el corazón del método simplex, y puede organizarse de tres formas distintas: 


1. En una tabla, como arriba. 
2. Actualizando B”* cuando la columna u tomada de N sustituye a la columna k de B. 
3. Calculando B = LU, y actualizando estos factores LU en vez de hacerlo con B”?. 


Esta lista constituye una breve historia del método simplex. En algunas formas, la eta- 
pa más fascinante es la primera —la tabla— que dominó el tema por muchos años. Para la 
mayoría de nosotros, trajo un aura de misterio a la programación lineal, principalmente 
porque se las arregló para evitar casi por completo la notación matricial (¡mediante el dis- 
positivo habilidoso de escribir por completo todas las matrices!) Para efectos computa- 
cionales (excepto para pequeños problemas en libros de texto), la época de la tabla ya 
terminó. 

Para ver por qué, recuerde que después de que el coeficiente más negativo en r indica 
cuál columna u entra a la base, no se utilizará ninguna de las otras columnas arriba de r. 
Fue una pérdida de tiempo calcularlas. En un problema más grande, cientos de columnas 
se calculan una y otra vez, justo para esperar su turno de entrar a la base. Esto permite que 
la teoría haga por completo las eliminaciones y alcanzar R. Sin embargo, en la práctica no 
es posible justificar esto. 

Es más rápido, y al final más simple, ver cuáles cálculos son realmente necesarios. Ca- 
da paso simplex intercambia una columna de Y por una columna de B. Estas columnas son 
decididas por r y a. Este paso comienza con la matriz base actual B y la solución actual 
e BD 








y Un paso del método simplex 





| e Se calculan el vector renglón A pS y] los costos dE E = = ON — E, AN. 





actual. qn 
4. Se actualiza E, el 0 OLU, así como la solución xg = 1 
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Algunas veces, lo anterior se denomina método simplex revisado para distinguirlo de 
las operaciones en la tabla. En realidad es el método simplex en sí, reducido. 
Este análisis termina una vez que se ha decidido cómo calcular los pasos 1, 3, y 4: 


L=caB"” veBluú y a =BUb (4) 


La forma más conocida es trabajar directamente con B”!, calculándola explícitamente en 
el primer vértice. En vértices subsecuentes, el paso de pivoteo es sencillo. Cuando la co- 
lumna k de la matriz identidad se sustituye por u, la columna k de B”! se sustituye por y = 
B”*u. Para reconvertir la matriz identidad, la eliminación multiplica la B7* anterior por 


1 


1 VU; 4 —U1 /Ur 
AS UL = 1/v; (5) 
ve l —Un [Ue 1 


En muchos códigos simplex se utiliza la forma de producto de la inversa, que ahorra 
estas simples matrices E”! en vez de actualizar directamente a B7*. Cuando es necesario, 
se aplican a b y cg. A intervalos regulares (quizá cada 40 pasos simplex), se vuelve a 
calcular B”* y la E”? se borra. En el problema 9 se comprueba la ecuación (5), al final de 
esta sección. 

En un método más reciente se usan los métodos normales del álgebra lineal numérica, 
considerando a la ecuación (4) como tres ecuaciones que comparten la misma matriz B: 


AB=c3, Buv=u, Bxg=b. (6) 


La factorización de costumbre B = LU (o PB = LU, con intercambios de renglones por ra- 
zones de estabilidad) conduce a las tres soluciones. £ y U pueden actualizarse, en vez de 
calcularlas de nuevo. 

Queda una pregunta: ¿Cuántos pasos simplex es necesario efectuar? Es imposible 
contestar de antemano. La experiencia indica que el método toca sólo alrededor de 3m/ 2 
vértices distintos, lo cual significa un conteo de operaciones aproximado de mn. Esto es 
comparable con la eliminación normal para Ax = b, y es la razón del éxito del método sim- 
plex. Sin embargo, las matemáticas muestran que la longitud de la ruta no siempre puede 
acotarse por cualquier múltiplo fijo o potencia de m. Los peores conjuntos factibles (Klee 
y Minty inventaron un cubo lobulado) pueden obligar a que el método simplex intente ca- 
da vértice, a costo exponencial. 

Fue el método de Khachtan lo que demostró que la programación lineal podía resol- 
verse en tiempo polinomial.” Su algoritmo permaneció dentro del conjunto factible, y cap- 
turó ax” en una serie de elipsoides que se contraen. La programación lineal está en la clase 
agradable P, no en la temible clase NP (como el problema del agente de ventas viajero). 
Para problemas NP, se considera (aunque no está demostrado) que todos los algoritmos de- 
terminísticos deben terminar en un tiempo interminablemente exponencial, en el peor de 
los casos. 

Todo este tiempo, el método simplex ha hecho su trabajo ——en un tiempo medio del 
que ya se ha demostrado (para variantes del método de costumbre) que es polinomial. Por 


* El número de operaciones está acotado por potencias de m y n, como en la eliminación. Para pro- 
gramación entera y factorización en primos, todos los algoritmos conocidos pueden ser exponencial- 
mente largos. La célebre conjetura “P >* NP” establece que tales problemas no pueden tener 
algoritmos polinomiales. 
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alguna razón, oculta en la geometría de poliedros de muchas dimensiones, los malos con- 
juntos factibles son raros y el método simplex tiene suerte. 


Niétodo de Karmarkar 


Ahora llegamos al evento más sensacional que ha ocurrido en la historia reciente de la pro- 
gramación lineal. Karmarkar propuso un método basado en dos conceptos simples, y en sus 
experimentos derrotó al método simplex. Tanto la elección del problema como los detalles 
del código son cruciales, y el debate sigue vigente. Sin embargo, las ideas de Karmarkar 
eran tan naturales y se ajustaban tan perfectamente al marco de referencia del álgebra li- 
neal aplicada, que pueden explicarse en unos cuantos párrafos. 

La primera idea es comenzar desde un punto que esté dentro del conjunto factible: se 
supondrá que es = (1, 1,..., 1). Debido a que el costo es cx, la mejor dirección para re- 
ducir el costo es hacia —c. Normalmente, lo anterior nos saca del conjunto factible; mover- 
se en esa dirección no preserva Ax = b. Si 4% = b y Ax! = b, entonces Ax = x! — 2 debe 
satisfacer AÁx = 0, El paso Ax debe estar en el espacio nulo de A. En consecuencia, —c 
se proyecta sobre el espacio nulo, con la finalidad de encontrar la dirección factible más pró- 
xima a la mejor dirección. Este es un paso natural pero costoso en el método de Karmarkar. 

El paso Áx es un múltiplo de la proyección —Pc. Mientras más grande sea el paso, más 
se reduce el costo, aunque no es posible salir del conjunto factible. El múltiplo de — Pc se 
escoge de modo que x! esté próximo, aunque un poco adentro, de la frontera en la cual una 
componente de x llega a cero. 

Así se completa la primera idea: la proyección que proporciona el descenso factible 
más pronunciado. El segundo paso requiere una nueva idea, ya que continuar en la misma 
dirección es inútil. 

La sugerencia de Karmarkar es transformar x? de vuelta a (1,1, ..., 1) en el centro. 
Su cambio de variables no era lineal, pero la transformación más simple es justo un rees- 
calamiento por una matriz diagonal D. Luego ya hay espacio para moverse. El reescala- 
miento desde x hasta X = D”*'x cambia las restricciones y el costo: 


Ax = b se vuelve ADX = b c*x se vuelve c*DX. 


En consecuencia, la matriz AD toma el sitio de A, y el vector c"D toma el lugar de c*. El 
segundo paso proyecta la nueva c sobre el espacio nulo de la nueva A. Todo el trabajo es- 
tá en esta proyección, para resolver las ecuaciones normales ponderadas: 


(AD?AB) y = AD?*c. (7) 


La forma normal para calcular y es por eliminación. El proceso de Gram-Schmidt ortogo- 
naliza las columnas de DA?, lo cual puede resultar costoso (aunque facilita el resto de los 
cálculos). El método favorito para problemas ralos grandes es el método del gradiente con- 
jugado, que proporciona la respuesta exacta más lentamente que la eliminación, aunque 
puede aplicarse parcialmente y luego detenerse. A mitad de la eliminación no es posible de- 
tenerse, 

Así como otras ideas nuevas en la computación científica, el método de Karmarkar tu- 
vo éxito en algunos problemas y en otros no. La idea subyacente fue analizada y mejorada. 
Un éxito primordial lo constituyen métodos de punto interior (que permanecen dentro del 
conjunto factible) más recientes, que se mencionan en la siguiente sección. Y el método 
simplex sigue siendo tremendamente valioso, como todo el tema de la programación lineal, 
que fue descubierta siglos después que Ax = b, aunque comparte las ideas fundamentales 
del álgebra lineal. De estas ideas, la que va más lejos es la de dualidad, que se presenta a 
continuación, 
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Conjunto de problemas 8.2 


1. 


10. 


Minimizar Xx, + Xx, — x3, sujeto a 


21 == 00 0 ka =4 
AED o 


¿Cuál de x,, x,, x3 debe entrar a la base, y cuál de xy, xs, debe salir? Calcule el nuevo 
par de variables básicas, y encuentre el costo en el nuevo vértice. 


Después del paso simplex precedente, prepare y decida el paso siguiente. 


En el ejemplo 3, suponga que el costo es 3x + y. Con reagrupamiento, el vector de 
costo es c = (0, 1, 3, 0). Demuestre que r > 0 y, en consecuencia, que el vértice P es 
óptimo. 

Suponga que la función de costo en el ejemplo 3 es x — y, de modo que después de un 
reagrupamiento c = (0, —1, 1, 0) en el vértice P. Calcule r y decida qué columna u 
debe ser elemento de la base. Entonces calcule B”*y y muestre desde su signo que 
nunca llegará a otro vértice. En la figura 8.3 estamos escalando el eje y y x — y llega 
a 00: 


De nuevo en el ejemplo 3, cambie el costo a x + 3y. Compruebe que el método sim- 
plex va de Pa QaR, y que el vértice R es óptimo. 


La Fase lI encuentra una solución factible básica de Ax = b (un vértice). Después de 
cambiar signos para hacer b > O, considere el problema auxiliar de minimizar w, + 
wi TF... + W,, sujeto ax > 0, w > 0, Ax + w = b. Siempre que Ax = b tiene una 
solución nonegativa, el costo mínimo en este problema es cero, con w” = 0. 


a) Demuestre que, para este nuevo problema, el vértice x = O, w = b es tanto bási- 
co como factible. En consecuencia, su Fase 1 ya está establecida, y el método sim- 
plex puede proceder para encontrar el par óptimo x”, w”. Si w” = O, entonces x" 
es el vértice requerido en el problema original, 

by ConA = [1 —1] y b = [3], escriba el problema auxiliar, el vector de su Fase 1 
x= 0, w = b, y su vector óptimo. Encuentre el vértice del conjunto factible 
Xx —Xx2=3,x1 > x2 > 0, y trace una figura de este conjunto. 


Si quisiera maximizarse el costo en vez de minimizarlo (con Ax = b y x > 0), ¿cuál 
sería la prueba de detención sobre r, y qué reglas escogerían la columna de N con la 
finalidad de hacerla básica y la columna de B para hacerla libre? 


Minimice 2x, + x2, Sujeto a xy + x2 >4,x] + 3x2 > 12,x, 7x2 >0,x > 0. 


Compruebe la inversa en la ecuación (5), y demuestre que BÉ tiene Bv = u en su 
k-ésima columna. Así, BE es la matriz básica correcta para la siguiente detención, 
ETB”? es su inversa, y E”? actualiza correctamente la matriz básica. 


Suponga que se quiere minimizar cx = xy, — x,, sujeto a 


2x1 — 4 + x3 


3x1 + Óx2 + x= 12 (toda x1, X2, X3, Xx4 > O). 


Empezando desde x = (0, O, 6, 12), ¿deben incrementarse x, o x, a partir de su valor 
actual de cero? ¿Cuánto puede incrementarse hasta que la ecuación obliga a cero a Xx 
o x4? En ese punto, ¿cuál es el nuevo x? 


A A A A A A A AAA A A A A A A 


| 
| 
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311. Para la matriz P =1 — AT(AAT)"! A, demuestre que si x está en el espacio nulo de 
A, entonces Px = x. El espacio nulo permanece sin cambio bajo esta proyección. 





12. a) Minimice el costo cx = 5x, + 4x, + 8x3 sobre el plano x, + x2 + x3 = 3, pro- 
bando los vértices P, O, R, donde el triángulo está cortado por el requerimiento 
x>”0 

b) Proyecte c = (5, 4, 8) sobre el espacio nulo de A = [1 1 1], y encuentre el paso má- 
ximo s que mantiene nonegativo a e — sPc. 





8.3 El PROBLEMA DUAL 


La eliminación puede resolver Ax = b, pero los cuatro subespacios fundamentales han de- 
mostrado que una comprensión diferente y más profunda es posible. Es exactamente lo 
mismo para la programación lineal. La mecánica del método simplex resuelve un progra- 
ma lineal, aunque la dualidad se encuentra en el centro de la teoría subyacente. La intro- 
ducción del problema dual es una idea elegante, que al mismo tiempo es fundamental para 
las aplicaciones. Se explicará tanto como entendemos. 

La teoría empieza con el problema original dado: 


ES “as e, SS. 


-> + Original SA Minimizar cx, sujeto ax 0yA4xz2b. Z 


El problema dual comienza a partir de las mismas A, b, y c, e invierte todo. En el proble- =, 
ma original, c está en la función de costo y b está en la restricción. En el problema dual, se Es 
cambian b y c. La incógnita dual y es un vector renglón con m componentes, y el conjun- q 
to factible tiene yA < c, en vez de Ax > b. 

En corto, el dual de un problema mínimo es un problema máximo. Ahora y > 0: 


O ON 


. Dual (Dd). Maximizar yb, sujeto ay >0yyA Sc. > 


El dual de este problema es el problema mínimo original. Hay simetría completa entre los 
problemas dual y original. El método simplex es igualmente válido para una maximiza- 
ción; en todo caso, ambos problemas se resuelven a la vez. 

Es necesario proporcionar una interpretación de todas estas inversiones. Aconsejan 
una competencia entre el minimizador y el maximizador. En el problema de la dieta, el mi- 
nimizador cuenta con n alimentos (mantequilla de cacahuate y bistec, en la sección 8.1). 
Entran en el problema de la dieta en las cantidades (nonegativas) x;, .. . , Xx. Las restric- 
ciones representan m vitaminas requeridas, en vez de una restricción anterior de suficien- 
tes proteínas. El elemento a¿, mide la ¡-ésima vitamina en el ¡-ésimo alimento, y el ¿-ésimo 
renglón de Ax > b obliga a que en la dieta se incluya por lo menos b, de esa vitamina. Si 
c, es el costo del j-ésimo alimento, entonces cx, + +++ + C4x, = cx es el costo de la die- 
ta. Este es el costo que debe minimizarse. 

En el dual, el farmacéutico vende píldoras de vitamina, a precios y; > 0. Debidoa , 
que el alimento j contiene vitaminas en las cantidades aj, el precio del farmacéutico para  P- 
el equivalente de vitaminas no puede exceder el precio c, del tendero. Esta es la j-ésimares- 
tricción en yA < c. Al trabajar dentro de esta restricción sobre los precios de las vitaminas, 
el farmacéutico puede vender la cantidad requerida b; de cada vitamina por un ingreso to- 
tal de y1b) pr DO. == Da maximizar. 
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Los conjuntos factibles para los problemas original y dual se ven completamente dife- 
rentes. El primero es un subconjunto de R”, marcado por x > 0 y Ax > b. El segundo es un 
subconjunto de R” determinado por y > 0 y A* y c. Toda la teoría de la programación li- 
neal radica en la relación que hay entre el original y el dual. A continuación se presenta el 
resultado fundamental: 





Si los vectores óptimos no existen, hay dos posibilidades: ya sea que ambos conjuntos fac- 
tibles son vacíos o uno es vacío y el otro problema no está acotado (el máximo es +00 o 
el mínimo es — 00). 

El teorema de dualidad establece la competencia entre el tendero y el farmacéutico. El 
resultado siempre es un empate. En la teoría de juegos se encuentra un “teorema minimax” 
semejante, El cliente no tiene ninguna razón económica para preferir las vitaminas a los ali- 
mentos, aun cuando el farmacéutico garantice igualar al tendero en cada alimento —=< in- 
cluso venda más barato los alimentos costosos (como la mantequilla de cacahuate). Se 
demostrará que los alimentos costosos se mantienen fuera de la dieta original, de modo que 
la salida puede ser (y es) un empate. 

Lo anterior puede parecer un punto muerto, aunque espero que el lector no se deje en- 
gañar. Los vectores óptimos contienen la información crucial. En el problema original, x” 
indica al comprador qué comprar. En el dual, y” fija los precios naturales (precios imagi- 
narios) alos cuales la economía debería marchar. En tanto nuestro modelo lineal refleje la 
verdadera economía, x” y y” representan las decisiones esenciales que han de tomarse. 

Se quiere demostrar que cx” = y"b, Puede parecer evidente que el farmacéutico 
pueda subir los precios y” de las vitaminas para encontrar al comprador, aunque sólo una 
cuestión es verdaderamente clara: Debido a que cada alimento puede sustituirse por su 
equivalente vitamínico, sin incremento en el costo, todas las dietas alimentarias idóneas de- 
ben costar por lo menos tanto como las vitaminas. Esta desigualdad es unilateral: precio del 
farmacéutico < precio del tendero. Se denomina dualidad débil, y es fácil demostrarlo pa- 
ra cualquier programa lineal y su dual: 





TRAE 


e 
Mio 


SE sE Sia X xy y so son n factibles e en nos problemas original y dual, entonces: Syb < E 133. 










Demostración Debido a que los vectores son factibles, satisfacen Ax > b y yA < c. De- 
bido a que la factibilidad también incluye x > 0 y y > O, es posible tomar productos inter- 
nos sin arruinar estas desigualdades (multiplicar por números negativos debe invertirlos): 


yAx>yb y  yAxs<cx. (1) 


Debido a que los miembros izquierdos son idénticos, se tiene la dualidad débil yb < cx. m 


Esta desigualdad unilateral prohíbe la posibilidad de que ambos problemas sean no 
acotados. Si yb es arbitrariamente grande, una x factible contradice yb < cx. De manera se- 
mejante, si cx puede ir hacia —oo, entonces el dual no puede admitir una y factible. 

Igualmente importante, cualesquiera vectores que alcancen yb = cx deben ser ópti- 
mos. En este punto el precio del tendero es igual al del farmacéutico. Una dieta alimenta- 
ria Óptima y los precios óptimos de las vitaminas se reconocen por el hecho de que el 
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consumidor no tiene nada que id 





Dia 
ni 


Debido a que ningún y puede hacer yb más grande que cx, la y que alcanza este valor 
es óptima. De manera semejante, cualquier x que alcance el costo cx = yb debe ser una x” 
Óptima. 

A continuación se proporciona un ejemplo con dos alimentos y dos vitaminas. Obser- 
ve que A* aparece cuando se escribe el dual, ya que yA < c para vectores renglón signifi- 
ca AFy* < c* para columnas. 


Original Minimizar x¡ + 4x3 Dual Maximizar 6y, +7y 
sujeto ax, >0,x2>0 sujeto a yy > 0, ya > 0 

2x1 + x>6 2 El 

ax + 3x2 >= 7. Y: + 3x2 < 4. 


Solución x, = 3 y xz = 0 son factibles, con costo x, + 4x, = 3. En el dual, y, = 3 y 
2 = O proporcionan el mismo valor 6y, + 7y, = 3. Estos vectores deben ser óptimos. 


Por favor, observe la situación detenidamente para ver lo que ocurre realmente en el 
momento en que yb = cx. Algunas de las restricciones de desigualdad son estrictas, lo cual 
significa que se cumple la igualdad. Otras restricciones son flojas, y la regla clave tiene sen- 
tido económico: 


ON DS dietas tene AñO =0 cuando el precio de los alimentos) js se + fja por r arriba des su ÁS 
co ¿equivalente vitamínico. y A o y os A o Es 


E) El; precio e es AE e == =0 cuando se tiene una a sobreoferta « de vitamina i en la dieta x x- 


En el ejemplo, x, = O porque el segundo alimento es demasiado costoso. Su precio exce- 
de el precio del farmacéutico, ya que y, + 3y, < 4 es una desigualdad estricta 3 + 0<4. 
De manera sernejante, la dieta requería siete unidades de la segunda vitamina, aunque en 
realidad proporcionó 5x, + 3x, = 15. Así, se encontró y, = O, y esta vitamina es un pro- 
ducto libre. Puede verse cómo se ha completado la dualidad. 

Estas condiciones de optimalidad pueden entenderse fácilmente en términos matricia- 
les. A partir de la ecuación (1) se quiere y"Ax” = y"b en el óptimo. La factibilidad requie- 
re Ax” > b, y se buscan cualesquiera componentes en las que fracase la igualdad. Esto 
corresponde a una vitamina que esté sobreofrecida, de modo que su precio es y* = 0, 

Al mismo supo se tiene y'A < c. Todas las restricciones estrictas (alimentos costo- 
sos) corresponden a x= = ( (omisión en la dieta). Esta es la clave para y"Ax” = cx”, que 
se requiere. Estas son las condiciones flojas complementarias de la programación lineal, 
y las condiciones de Kuhn-Tucker de programación no lineal: 





A continuación se repite la demostración. Cualesquiera vectores factibles x y y satisfacen 
la dualidad débil: 


yb < y(Ax) =(yAdx <cx. (3) 
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Se requiere la igualdad, y sólo hay una forma en que y“b puede ser igual a y'(Ax%). Cada 
vez que b, < (Ax*);, el factor y," que multiplica a estas componentes debe ser cero. 

De manera semejante, la factibilidad proporciona yAx < cx. La igualdad se obtiene só- 
lo cuando se cumple la segunda condición de flojera. S1 hay un sobreprecio On A), < C;, de- 
be cancelarse a través de la multiplicación por x = 0, ZasÍ, se queda con y'b = cx” en la 
ecuación (3). Esta igualdad garantiza la cotimalidad de x" y y”. 


Demostración de la dualidad 


La desigualdad unilateral yb < cx fue fácil de demostrar; proporcionó una prueba rápida 
para vectores Óptimos (la convierten en igualdad); y ahora ha proporcionado las condicio- 
nes de flojera en la ecuación (2). Lo único que no ha hecho es mostrar que y'b = cx” real- 
mente es posible. El teorema de dualidad no está completo sino hasta que se obtienen estos 
vectores óptimos. 

Para obtener y”, se regresa al método simplex, que ya ha calculado x". El problema 
consiste en mostrar que el método se detuvo en el momento indicado para el problema dual 
(aun cuando se construyó para resolver el problema original). Recuerde que las m desigual- 
dades Ax > b se cambiaron a ecuaciones, mediante la introducción de las variables flojas 
We Ar =D 


A SE > E Xx 
Factibilidad original [A eL: ] lA =b y lo > 0: (4) 
Cada paso simplex escogió m columnas de la matriz larga [A —/] para hacerlas básicas, y 
las desplazó (teóricamente) hacia el frente. Así se obtuvo [B NJ]. El mismo desplazamien- 
to reordenó el largo vector de costo [c 0] en [cg ceyl. La condición de detención, que lle- 
vó a término al método simplex, era r =cy —cgB"N >0. 
Esta condición r > O se alcanzó finalmente, ya que el número de vértices es finito. En 
ese momento, el costo era lo más bajo posible: 


A BA z 
Costo mínimo cx* =|[cg cy] | 0 d =c2B"!b, (5) 
Si en el dual puede escogerse y* = cgB”?, ciertamente se tiene y*b = cx*. El míni- 
mo y el máximo son iguales. Debe demostrarse que esta y” satisface las restricciones dua- 
les yA <cyy>0: 


Factibilidad dual ea (6) 


Cuando el método simplex vuelve a mezclar la gran matriz y el vector para poner primero 
las variables básicas, esto reagrupa las restricciones en la ecuación (6) como 


y [BN] Sen con]: (7) 


Para y* = cg¿B”!, la primera mitad es una igualdad y la segunda es cgB"'N < cy. ¡Esta 
es la condición de detención r > O que se sabe debe cumplirse! En consecuencia, la y es 
factible, y se ha demostrado el teorema de dualidad. Al localizar la matriz crítica B de m 
por m, que es no singular en tanto esté prohibida la degeneración, el método simplex ha 
producido la y” Óptima, así como 1”. 
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Precios imaginarios 


En cálculo, todo mundo conoce la condición para un máximo o un mínimo: las primeras 
derivadas son cero. Sin embargo, este hecho es transformado completamente por las res- 
tricciones. El ejemplo más sencillo es la recta y = x. Su derivada nunca es cero, el cálculo 
parece inútil, y ciertamente la mayor y ocurre al final del intervalo. ¡Esta es exactamente la 
situación en programación lineal! Hay más variables, y un intervalo se sustituye por un 
conjunto factible, aunque el máximo sigue encontrándose en un vértice del conjunto facti- 
ble (con sólo mm componentes diferentes de cero). 

El problema en programación lineal es localizar ese vértice. Para este efecto, el cálcu- 
lo no es completamente inútil. Lejos de ello, porque los “multiplicadores de Lagrange” 
harán cero las derivadas en el máximo y en el mínimo. Las variables duales y son exacta- 
mente los multiplicadores de Lagrange. Y responden la pregunta clave: ¿Cómo cambia el 
costo mínimo cx” = y"b, si se cambian b o c? 

Esta es una pregunta en análisis de sensibilidad. Permite obtener información adicio- 
nal del problema dual. Para un economista o un ejecutivo, estas preguntas sobre costo mar- 
ginal son las más importantes. 

Si se permiten grandes cambios en b o en c, la situación se comporta de manera bastan- 
te irregular. Cuando aumenta el precio de los huevos, hay un punto en el que éstos desapa- ! 
recen de la dieta. La variable xhueyo salta de básica a libre. Para seguirla correctamente, es Jj 
necesario introducir programación “paramétrica”. Pero si los cambios son pequeños, el vér- 
tice que era óptimo permanece siendo óptimo. La elección de las variables básicas no 
cambia; B y N siguen siendo las mismas. Geométricamente, el conjunto factible se ha des- 

, plazado un poco (al cambiar b), y los planos que lo cortan se han inclinado (al cambiar c). 
Cuando estos cambios son pequeños, el contacto ocurre en el mismo vértice (que se ha mo- | 
vido ligeramente). Ed 

Al final del método simplex, cuando se conocen las variables básicas idóneas, las m : 
columnas correspondientes de A constituyen la matriz base B. En ese vértice, un desplaza- 
miento de tamaño Ab modifica el costo mínimo por y"Ab. La solución dual y" propor- 
ciona la razón de cambio del costo mínimo (su derivada) respecto a cambios en b. Las 
componentes de y” son los precios imaginarios. Si el requerimiento para una vitamina su- 
be por A y el precio del farmacéutico es y,, entonces el costo de la dieta (del farmacéutico 
o del tendero) sube por y; A. En el caso en que y, es cero, esa vitamina es un producto li- 
bre y el pequeño cambio no tiene ningún efecto. La dieta ya contenía más que b,. 

Ahora se plantea una pregunta diferente. Suponga que se insiste en que la dieta con- E 
tenga una pequeña cantidad digerible de huevo. La condición Xnuevo > O cambia A Xuevo 2. 
8. ¿Cómo modifica esto al costo? E 

Si en la dieta x" hubiera huevo, no habría ningún cambio. Pero si Xicevo = 0, habrá un == 
costo extra por agregar la cantidad 8. El incremento no será en todo el preciO Chuevod, ya. 
que es posible reducirlo de los otros alimentos. El costo reducido de los huevos es su pro- | 
pio precio, menos el precio que se paga por el equivalente en alimentos más baratos. Para 
calcularlo, se regresa a la ecuación (2) de la sección 8.2: 





S1 el huevo es la primera variable libre, entonces el incremento de la primera componente 
de xy a 0 aumenta el costo por r,ó. El verdadero costo del huevo es r,. Este es el cambio 
en el costo de la dieta cuando la cota inferior cero (restricción de no negatividad) se mue- 
ve hacia arriba. Se sabe que r > 0, y la economía indica lo mismo: el costo reducido de los 
huevos no puede ser negativo, o habrían entrado a la dieta. 
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El método simplex se mueve a lo eS de los vértices del a ol para llegar fi- 
nalmente al vértice óptimo x”. Los métodos de puntos interiores empiezan dentro del con- 
junto factible (donde todas las restricciones son desigualdades). Estos métodos esperan 
moverse directamente a x” (y también encontrar y”). Una vez que están muy próximos a la 
respuesta, se detienen. 

Una forma de permanecer dentro es colocando una barrera en la frontera. Agregar un 
costo extra en la forma de un logaritmo que se infla cuando cualquier variable x o cualquier 
variable floja w = Ax — b toca cero. El número € es un pequeño parámetro a escoger: 


Problema con barrera P(0) Minimizar cx — 6 (E nx; + y la ws) (8) 
1 1 


Este costo es no lineal (aunque la programación lineal de hecho ya no es lineal, a partir de 
las desigualdades). La notación es más simple si el vector largo (x, w) vuelve a identificar- 
se como x y [A —/] se vuelve a identificar como A. Ahora, las restricciones originales son 
x > 0yAx = b. La suma de ln x, en la barrera pasa ahora am + n. 

Las restricciones duales son yA < c. (Cuando se tiene Ax = b en el original no se re- 
quiere y > 0). La variable floja es s = c — yA, con s > 0. ¿Cuáles son las condiciones de 
Kuhn-Tucker para que x y y sean las x" y y” óptimas? Junto con las restricciones se requie- 
re dualidad: cx" = yb, 

Incluyendo la barrera se obtiene un problema aproximado P(0). Para sus condiciones 
de Kuhn-Tucker de optimalidad, la derivada de In x, proporciona 1/x,. Si a partir de estos 
números positivos x, se crea una matriz diagonal X, y se usae = [1 ... 1] para el renglón 
vector de n + m unos, entonces la optimalidad en P (0) es como sigue: 


Original (vectores columna) Ax =b con x>0 (9a) 
Dual (vectores renglón) yA +0eX "7" =cCc (9b) 


Cuando 0 —>- 0, es de esperar que las x y y óptimas tiendan a x” y y” para el problema ori- 
ginal sin barrera, y que 0eX”* permanezca no negativo. El plan es resolver las ecuaciones 
(9a y 9b) con barreras cada vez más pequeñas, dadas por el tamaño de 0, 

En realidad, estas ecuaciones no lineales se resuelven aproximadamente con el méto- 
do de Newton (lo cual significa que son linealizadas). El término no lineal es s = 9eX”?. 
Para evitar 1/x,, lo anterior se vuelve a escribir como sX = Oe. Al crear la matriz diagonal 
S a partir de s, ésta es eSX = Oe. Si e, y, c, y s se cambian a vectores columna, y se traspo- 
ne, ahora la optimalidad consta de tres partes: 


Original AR =D 200. (10a) 
Dual Aty+s=c. (10b) 
No lineal XSe —0e =0. (100) 


El método de Newton requiere un paso Ax, Ay, As, a partir de las x, y, s, actuales. (És- 
tas resuelven las ecuaciones (10a) y (105), pero no la (10c).) Al ignorar el término de se- 
gundo orden AXASe, ¡las correcciones provienen de ecuaciones lineales! 


AAx =0. (11a) 
Paso de Newton ATAy+As =0. (110) 
SAx+XAs = 0e — XSe. (110) 


| 
| 
| 
| 
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Las notas de Robert Freund para su curso en el MIT afianzan la razón de convergencia 
(cuadrática) y la complejidad computacional de este algoritmo. Sin importar las dimensio- 
nes m y n, la brecha de dualidad sx suele estar abajo de 10”* luego de entre 20 a 80 pasos 
de Newton. Este algoritmo se utiliza casi “como es” en software comercial de punto inte- 
rior, así como para una amplia variedad de problemas de optimización no lineal. 


Teoría de las desigualdades 


La dualidad puede estudiarse en más de una forma. Rápidamente se demostró yb < cx, y 
luego se aplicó el método simplex para obtener la igualdad. Esta es una prueba construc- 
tiva; x” y y” se calculan en realidad. A continuación se aborda brevemente un método dife- 
rente, en el que se omite el algoritmo simplex, y se analiza más directamente la geometría. 
Considero que los conceptos clave son igualmente claros (de hecho, quizá más claros) si 
se omiten algunos detalles. 

La mejor ilustración de este método se encuentra en el Teorema Fundamental del ÁL- 
gebra Lineal. El problema en el capítulo 2 consistía en encontrar b en el espacio columna 
de A. Después de la eliminación y los cuatro subespacios, la cuestión de resolubilidad fue 
respondida en una forma completamente distinta por el problema 11 en la sección 3.1: 
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Este es el teorema de la alternativa, porque encontrar tanto a x como a y es imposible: si j e 
Ax = bentonces yAx = yb % O, lo cual contradice a yAx = Ox = O. En el lenguaje de los E 


Eb 
Y 


> IS z de 


subespacios, b está en el espacio columna, o tiene una componente adherida en el espacio 
nulo izquierdo. Esta componente es la y que se busca. 

Para desigualdades, se desea encontrar un teorema que sea exactamente del mismo 
tipo. Se empieza con el mismo sistema Ax = b, pero se agrega la restricción x > O. ¿Cuán- 
do existe una solución nonegativa de Ax = b? 

En el capítulo 2, b estaba en cualquier parte del espacio columna. Ahora sólo se per- 
miten combinaciones nonegativas, y las bs ya no llenan un subespacio. En vez de lo ante- 
rior, ocupan una región en forma de cono. Para n columnas en R”, el cono se convierte en 
una pirámide de extremo abierto. En la figura 8.4 se muestran cuatro vectores en R?, y A 
es de 2 por 4. Si b está en este cono, existe una solución nonegativa de Ax = b; en caso 
contrario, no. 
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Figura 8.4 Cono de las combinaciones nonegativas de las columnas: b = Ax con x > 0. 
Cuando b está fuera del cono, está separado por un hiperplano (perpendicular a y). 
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¿Cuál es la alternativa si b está fuera del cono? En la figura 83.4 también se muestra 
un “hiperplano de separación” que tiene, al vector b en un lado y a todo el cono en el otro 
lado. El plano consta de todos los vectores perpendiculares a un vector fijo y. El ángulo en- 
tre y y bes mayor que 90%, por lo que yb < 0. El ángulo entre y y toda columna de A es me- 
nor que 90%, de modo que yA > 0. Esta es la alternativa que se buscaba. Este teorema del 
peto de separación es fundamental para la economía matemática. 








a al , : Ar -= bi tiene una a solución nonegativa, 9 o bien, existe una ayo con m4> > -0 y 1: < do 


Las combinaciones nonegativas de las columnas de A = / llenan el cuadrante positivo 
b > 0. Para cualquier otra b, la alternativa debe cumplirse para alguna y: 


No está en 


; Ze ; Ñ 
el cono NOS ES] , entonces y = [0 1] proporciona y/ > 0 pero yb = 3, 


El eje x, perpendicular a y = [0 1], separa b del cono = cuadrante. 


A continuación se presenta un par de alternativas curiosas. Es imposible que un subes- 
pacio S y su complemento ortogonal S”* contengan vectores positivos. El producto interno 
debe ser positivo, no cero. Sin embargo, $ podría ser el eje x y S* podría ser el eje y, en cu- 
yo caso contienen a los vectores “semipositivos” [1 0] y [O 1]. Esta alternativa ligeramen- 
te más débil funciona: Ya sea que S contiene un vector positivo x > 0, o que S” contiene 
un y > 0 diferente de cero. Cuando S y S* son rectas perpendiculares en el plano, una o la 
otra deben estar en el primer cuadrante, No puedo ver claramente esto en tres o cuatro di- 
mensiones. 

Para la programación lineal, las alternativas importantes provienen cuando las restric- 
ciones son O al ocurre que el cad factible es vacío ma xy? 








a Ax: > -D! tiene y una solución > 4 - 0: o o bien existe us una ay S < < 06 con m4 > > 0 y yo: <= 0. 


Demostración Las variables flojas w = Ax — b cambian a Ax > b en una ecuación. Se apli- 
ca 81: 


Primera alternativa [A =[ | pS =b- para algún a > 0. 
Segunda alternativa y[A -—1]>[0 0] para alguna ycon yb<0. M 


Este es el resultado que conduce a una “demostración no constructiva” del teorema de dua- 
lidad. 





Conjunto de problemas 8.3 


1. ¿Cuál es el dual del siguiente problema: Minimizar x, + xp, sujeto a x, > 0, x2 > 0, 
2x1 > 4,x1 + 3x2 > 11? Encuentre la solución de este problema y su dual, y com- 
pruebe que el mínimo es igual al máximo. 


2. ¿Cuál es el dual del siguiente problema: Maximizar yo, sujeto a y, > 0, y2 > 0, 
y, + ya < 37 Resuelva este problema y su dual. 


3. Suponga que A es la matriz identidad (de modo que m = n), y que los vectores b y c 
son nonegativos. Explique por qué x" = b es óptimo en el problema del mínimo, en- 
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10. 


11. 


12. 


13, 


14, 


ES: 


cuentre y” en el problema del máximo, y compruebe que los dos valores son iguales. 
Si la primera componente de b es negativa, ¿cuáles son x" y y"? 


Construya un ejemplo de 1 por 1 donde Ax > b,x > 0 €s no factible, y el problema 
dual no esté acotado. 


Empezando con la matriz de 2 por2 A = lo E , escoja b y c de modo que los dos 
conjuntos factibles Ax > b,x>0 y yA <c,y >0 sean vacíos. 


Si todos los elementos de A, b, y c son positivos, demuestre que tanto el original co- 
mo el dual son factibles. 


Demuestre que x = (1, 1, 1, 0) y y = (1, 1, 0, 1) son factibles en el original y en el 
dual, con 
Y OLA O 1 1 
2 lo ROS 0 e | tal 
a e a 
ll SOL AOE rd 1 3 


Luego, después de calcular cx y yb, explique cómo se sabe que son óptimos. 


Verifique que los vectores en el ejercicio previo satisfacen las condiciones de flojedad 
complementarias en la ecuación (2), y encuentre la desigualdad floja tanto en el origi- 
nal como en el dual, 


Suponga que Á = : al b= El y o= 1. Encuentre las x y y óptimas, y 


compruebe las condiciones de flojedad complementarias (así como yb = cx). 


Si el problema original se restringe por ecuaciones en vez de por desigualdades —Mi- 
nimizar cx sujeto a Ax = b y x > O— luego, el requerimiento y > O se deja fuera del 
dual: Maximizar yb sujeto a yA < c. Demuestre que la desigualdad unilateral yb < cx 
sigue cumpliéndose. ¿Por qué en la ecuación (1) se requería y > O pero aquí no es ne- 
cesario? Esta dualidad débil puede completarse para dualidad total. 


a) Sin utilizar el método simplex, minimice el costo 5x, + 3x2 + 4x3, Sujeto a 
xa t+x+x>1lx>0,% >0, x3 > 0. 

b) ¿Cuál es la forma del conjunto factible? 

Cc) ¿Cuál es el problema dual, y cuál es su solución y? 


Si el problema original tiene una solución única x”, y luego c se modifica ligeramen- 
te, explique por qué x” sigue siendo la solución óptima. 


Escriba el dual del siguiente problema: Maximizar x¡ + 12 + x3 sujeto a 2x1 + x2 < 4, 
x3 < 6. ¿Cuáles son las x" y y” óptimas (¡en caso de existir!)? 
SiA= É i , describa el cono de combinaciones nonegativas de las columnas. Si b 


está dentro del cono, por ejemplo b = (3, 2), ¿cuál es el vector factible x? Si b está fue- 
ra, por ejemplo b = (0, 1), ¿qué vector y sigue satisfaciendo la alternativa? 


En tres dimensiones, ¿es posible encontrar un conjunto de seis vectores cuyo cono de 
combinaciones nonegativas llene todo el espacio? ¿Qué puede decir sobre cuatro vec- 
tores? 
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16. Use 8H para demostrar que la siguiente ecuación no tiene solución, ya que la alterna- 


tiva se cumple: 
O E | 
A y Y 
17. Use 81 para demostrar que no hay solución x > O (la alternativa se cumple): 


1.0.3 -s] [2 
y A A A 


18. Demuestre que las alternativas en 8] (Ax > b,x > 0,y4 > 0,yb<0, y < 0) no 
pueden cumplirse. Sugerencia: yÁx. 





8.4 MODELOS DE REDES 


Algunos problemas lineales tienen una estructura que llega muy rápido a su solución. Las 
matrices de banda tienen elementos diferentes de cero cerca de la diagonal principal, y es 
fácil resolver Ax = b. En programación lineal, se tiene interés en la clase especial para la 
cual A es una matriz de incidencia. Sus elementos son —1 o +1, o (en su mayoría) cero, 
y los pasos de pivoteo sólo implican sumas y restas. Es posible resolver problemas mucho 
más grandes que los de costumbre. 

Las redes se presentan en todo tipo de aplicaciones. La circulación en un crucero sa- 
tisface las leyes de la corriente de Kirchhoff.: el flujo que entra es igual al flujo que sale. 
Para gas y petróleo, la programación de redes ha diseñado sistemas de conducción que son 
millones de dólares más baratos que los diseños intuitivos (no optimizados). ¡La programa- 
ción de pilotos, tripulaciones y aviones se ha convertido en un problema importante en 
matemáticas aplicadas! Incluso se resuelve el problema del matrimonio: maximizar el nú- 
mero de matrimonios cuando las novias están vetadas. Este problema puede no ser real, pe- 
ro es uno que resuelve la programación de redes. 

El problema en la figura 8.5 consiste en maximizar el flujo de la fuente al sumidero. 
Los flujos no pueden exceder las capacidades indicadas en las aristas, y las direcciones pro- 
porcionadas por las flechas no pueden invertirse. El flujo sobre las dos aristas hacia el su- 
midero no puede exceder 6 + 1 =7. ¿Es posible alcanzar este total de 7? ¿Cuál es el flujo 
máximo de izquierda a derecha? 

Las incógnitas son los flujos x,, del nodo ¿al nodo /. Las restricciones de capacidad son 
Xx £ Cij. Los flujos son nonegativos: x,; > O en dirección de las flechas. Al maximizar el flu- 
jo de regreso xs, (la recta punteada), se maximiza el flujo total hacia el sumidero. 





Figura 8.5 Red con 6 nodos con aristas de capacidad: el problema del flujo máximo. 
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Aún se escuchará hablar de otra restricción. Se trata de la “ley de conservación”: el flu- 
jo que entra en cada nodo es igual al flujo que sale de cada nodo. Esta es la ley de la co- 
rriente de Kirchhoff: 


Ley de la corriente S xs AR =(Q para ¡=1,2,..., 6. (y) 
i k 





Los flujos x,¿ entran al nodo j provenientes de nodos previos i. Los flujos x;z salen del no- 
doja nedos posteriores k. El balance de la ecuación (1) puede escribirse como Ax = O, 
donde A es una matriz de incidencia nodo-arista (la traspuesta de la sección 2.5). A tiene 
una flecha por cada nodo y una columna +1, —1 para cada arista: 


a: 1 1 


Matriz de  A= 
incidencia 


o 1 
arista 12 13 24 25 34 33 46 56 6l 


Flujo máximo Maximizar x6, sujeto a Ax =0 y 0<x;; <C;jj. 


Un flujo de 2 puede ir en la trayectoria 1-2-4-6-1. Un flujo de 3 puede ir a lo largo de 1-3- 
4-6-1. Un flujo adicional de 1 puede seguir la trayectoria más corta 1-3-5-6-1. El total es 
6, y nada más es posible. ¿Cómo se demuestra que el flujo maximal es 6 y no 7? 

El método al tanteo es convincente, pero las matemáticas son concluyentes: La clave 
es encontrar un corte en la red, a través del cual todas las capacidades se llenen. Este cor- 
te separa los nodos 3 y 6 de los demás nodos. Las aristas que van directamente a través del 
corte tienen una capacidad total de 2 + 3 + 1 = 6, ¡y nada más puede cruzar! La dualidad 
débil establece que cada corte constituye una cota para el flujo total, y la dualidad total es- 
tablece que el corte de menor capacidad (el corte minimal) se llena a el nabo maximal. 






- capacidad total a través del corte Minim al 


Un “corte” separa los nodos en dos grupos $ y T (fuente en $ y sumidero en 7). Su capa- 
cidad es la suma de las capacidades de todas las aristas que cruzan desde el corte (de S a 
T). Varios cortes podrían tener la misma capacidad. Ciertamente, el flujo total nunca pue- 
de ser mayor que la capacidad total a través del corte minimal. El problema, aquí y en to- 
do lo que concierne a la dualidad, es demostrar que la igualdad se alcanza gracias al flujo 
y el corte idóneos. 


Demostración de que flujo máx = corte mín Suponga que un flujo es maximal. Algu- 
nos nodos aún podrían alcanzarse desde la fuente mediante flujo adicional, sin exceder nin- 
guna de las capacidades. Estos nodos van con la fuente hacia el conjunto S. El sumidero 
debe estar en el conjunto restante T, o bien, ¡hubieran recibido más flujo! Cada arista a tra- 
vés del corte debe llenarse, o flujo adicional podría avanzar más lejos hacia el nodo en T. 
Así, el flujo maximal llena este corte a su capacidad y se ha alcanzado la igualdad. E 
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Lo anterior sugiere una forma de construir el flujo maximal: Comprobar si alguna tra- 
yectoria posee una capacidad no utilizada. En caso de encontrar una, agregar flujo a lo lar- 
go de la “trayectoria aumentada”. Luego, calcular las capacidades restantes y decidir si el 
sumidero está cortado respecto a la fuente o si es posible añadir flujo adicional. Si cada no- 
do en $ se identifica con el nodo previo del que pudo provenir el flujo, entonces es posible 
realizar un rastreo para encontrar la trayectoria del flujo adicional. 


El problema del matrimonio 


Suponga que hay cuatro mujeres y cuatro hombres. Algunas de estas 16 parejas son com- 
patibles y otras no. ¿Cuándo es posible encontrar un emparejamiento completo, en la que 
todos estén casados? Si el álgebra lineal es capaz de trabajar en el espacio de dimensión 20, 
ciertamente puede manejar el problema trivial del matrimonio. 

Hay dos formas de presentar el problema: en una matriz o en una gráfica. La matriz 
contiene aj; = O si la /-ésima mujer y el j-ésimo hombre no son compatibles, y ay = 1 si 
están intentando ser compatibles. Así, el renglón i proporciona las opciones de la ¿-ésima 
mujer, y la columna j corresponde al ¡-ésimo hombre: 


Matriz de compatibilidad A = tiene 6 pares compatibles 


2 50 200510 
1 MOS SSA: LI, 
0. 00-05 1 
1 

La gráfica de la izquierda en la figura 8.6 muestra dos matrimonios posibles. Ignorando la 
fuente s y el sumidero f, tiene cuatro mujeres en la izquierda y cuatro hombres en la dere- 
cha. Las aristas corresponden a los 1s en la matriz, y las capacidades son 1 matrimonio. 
Entre la primera mujer y el cuarto hombre no hay aristas, ya que la matriz tiene 4,4 = 0. 

Podría parecer que no es posible alcanzar el nodo M, por más flujo, ¡pero éste no es 
el caso! El flujo adicional a la derecha va de regreso para cancelar un matrimonio existen- 
te. Este flujo adicional realiza tres matrimonios, lo que es maximal. El corte minimal lo cru- 
zan 3 aristas. 

Un emparejamiento completo (en caso de ser posible) es un conjunto que tiene cuatro 
1s en la matriz. Éstos pueden provenir de cuatro renglones distintos y cuatro columnas di- 
ferentes, ya que no se permite la bigamia. Es como encontrar una matriz de permutación 
dentro de los elementos de A diferentes de cero. En la gráfica, esto significa cuatro aristas 
sin ningún nodo en común. El flujo maximal es menor que 4 exactamente cuando un em- 
parejamiento completo es imposible. 









“dápacidad 
de ES E 





1 1 
Figura 8.6 Dos matrimonios a la izquierda, tres (máximo) a la derecha. El tercero es crea- 
do agregando dos nuevos matrimonios y un divorcio (flujo hacia atrás). 
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En nuestro ejemplo, el flujo maximal es 3, no 4. Se permiten los matrimonios 1-1, 2-2, 
4-4 (así como varios otros conjuntos de tres matrimonios), aunque no hay forma de lograr 
cuatro. El corte minimal a la derecha separa a las dos mujeres en el fondo de los tres hom- 
bres en la parte superior. Las dos mujeres sólo tienen un hombre restante para elegir, lo cual 
no es suficiente. La capacidad a través del corte es sólo de 3, 


Siempre que hay un subconjunto de k mujeres que deben decidir entre un conjun- 


to menor que k hombres, un emparejamiento completo es imposible. 





La prueba es decisiva. La misma imposibilidad puede plantearse en varias formas: 


1. (Para ajedrez) Resulta imposible poner cuatro peones en escagues que tienen 1s en 
A, de modo que bajo enroque no es posible, puede comer a cualquier otro enroque. 


2. (Para matrices de matrimonio) Los 1s en la matriz pueden cubrirse con tres líneas 
horizontales o verticales. Esto es igual al número de matrimonios. 


3. (Para álgebra lineal) Toda matriz con los mismos ceros que A es singular. 


Recuerde que el determinante es una suma de 4! = 24 términos. En cada término se utili- 
zan los cuatro renglones y columnas. Los ceros en A hacen cero a todos los 24 términos. 

¡Un bloque de ceros impide un emparejamiento completo! La submatriz de 2 por 3 en 
los renglones 3 y 4 y en las columnas 1, 2, 3 de A es completamente cero. La regla gene- 
ral para una matriz de n por n es que un bloque p por q de ceros impide un emparejamien- 
to sí p + q > n. Aquí las mujeres 3, 4 sólo podrían casarse con 4 hombres. Si p mujeres 
pueden casarte con n — q y p > n — q hombres (lo cual es igual al bloque cero con p + 
q > n), de modo que un emparejamiento completo es imposible. 

El problema matemático es demostrar lo siguiente: si a todo conjunto de p mujeres le 
agrada por lo menos p hombres, un emparejamiento completo es imposible. Esta es la 
condición de Hall. Ningún bloque de ceros es demasiado grande. Cada mujer debe agra- 
darle por lo menos a un hombre, dadas dos mujeres, una de ellas debe agradarle por lo me- 
nos a dos hombres, y así sucesivamente, hasta p = n, 


81 “Un emparejamiento completo es posible si (y sólo si) se cumple la condición de... 
Ha A A o RO 


La demostración es más sencilla si las capacidades son n, en vez de 1, sobre todas las 
aristas a través de la parte de en medio. Las capacidades que salen de la fuente y se dirigen 
hacia el sumidero siguen siendo 1. Si el flujo maximal es n, entonces las aristas que van de 
la fuente al sumidero están llenas, y el flujo produce n matrimonios. Cuando un empareja- 
muento completo es imposible y el flujo máximo está por abajo de », algún corte debe ser 
responsable. 

Ese corte mantiene a la capacidad por abajo de n, de modo que las aristas de en me- 
dio la cruzan. Suponga que p nodos a la izquierda y r nodos a la derecha están en el con- 
junto $ con la fuente. La capacidad a través de ese corte está a n — p de la fuente a las 
mujeres restantes, y a r de estos hombres al sumidero. Debido a que la capacidad de corte 
está por debajo de n, las p mujeres sólo agradan a los r hombres y a ningún otro. Sin em- 
bargo, la capacidad n — p + restá por abajo de n exactamente cuando p > r, y la condi- 
ción de Hall fracasa. 


Arboles generadores y el algoritmo avaro 


Uno de los modelos fundamentales de redes es el problema de la ruta mínima, donde las 
aristas tienen longitudes en vez de capacidades. Se busca la ruta más corta de la fuente al 
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sumidero. Si las aristas son líneas telefónicas y las longitudes son tiempos de retraso, se es- 
tá encontrando la ruta más rápida para una llamada. Si los nodos son computadoras, se 
está buscando el protocolo perfecto para pasar el mensaje. 

Un problema estrechamente relacionado encuentra el árbol generador más corto: un 
conjunto de n — l aristas que unen todos los nodos de la red. En vez de ir rápidamente de 
una fuente a un sumidero, ahora se está minimizando el costo de conectar todos los nodos. 
No hay ciclos porque el costo de cerrar un ciclo es innecesario. Un árbol generador conec- 
ta los nodos sin ciclos, y se desea encontrar el más corto. A continuación se presenta un al- 
goritmo posible: 


1. Se empieza en cualquier nodo s y se repite el paso siguiente: 
Sumar la arista más corta que une el árbol actual a un nuevo nodo. 


En la figura 8.7, las longitudes de las aristas se observan en el orden 1, 2, 7, 4, 3, 6. El úl- 
timo paso omite la arista de longitud 5, que cierra un ciclo. La longitud total es 23, pero, 
¿es mínimo? La arista de longitud 7 se aceptó muy fácil, y el segundo algoritmo propor- 
ciona una longitud más larga. 









Y ¿siguiente? 


Y 3 ¿siguiente? 2 
de 





Figura 8.7 Red y árbol generador más corto de longitud 23. 


2. Aceptar las aristas en orden creciente de longitud, rechazando las aristas que comple- 
tan un ciclo. 


«Ahora las aristas se presentan en el orden 1, 2, 3, 4, 6 (rechazando 5 de nuevo), y 7. 
Son las mismas aristas, aunque esto no ocurre siempre. Su longitud total es la misma, lo 
cual ocurre siempre. El problema del árbol generador es excepcional, porque puede re- 
solverse en un paso. 

En el lenguaje de la programación lineal, primero se está encontrando el vértice ópti- 
mo. El problema del árbol generador se resuelve como en la sustitución hacia atrás, sin pa- 
sos falsos. Este método general se denomina algoritmo avaro. A continuación se presenta 
otra idea codiciosa: 


3. Construir árboles a partir de todos los n nodos, repitiendo el paso siguiente: 
Seleccionar cualquier árbol y sumar la arista de longitud mínima que sale de ese árbol. 


Los pasos dependen del orden de selección de los árboles. Para permanecer en el mismo 
árbol es el algoritmo 1. Tomar las longitudes en orden es el algoritmo 2. Barrer a través de 
todos los árboles a la vez es un nuevo algoritmo. Se oye muy fácil, pero para un gran pro- 
blema la estructura de los datos se vuelve crítica. Con mil nodos, podría haber cerca de un 
millón de aristas, y no es recomendable repasar esta lista mil veces. 


Modelos de redes adicionales 


Los siguientes problemas están relacionados para hacer coincidir y son casi tan fáciles: 


1. El problema de la asignación óptima: a,, mide el valor del aspirante ¡ al puesto j. Asig- 
nar puestos para maximizar el valor total —la suma de los a, sobre los puestos asig- 
nados. (Si todos los a, son 0D o 1, este es el problema del matrimonio.) 


A A A 
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2. 


El problema de transporte: Dados suministros en n puntos y demandas en n merca- 
dos, escoger embarques x;,, de los proveedores a los mercados que minimicen el costo 
total Y * C;¡x;;. (Si todos los suministros y las demandas son 1, este es el problema de 
la asignación Óptima: enviar una persona a cada puesto.) 


Flujo de costo mínimo: Ahora las rutas tienen capacidades c;, así como costos C; 
mezclando el problema de flujo máximo con el problema de transporte. ¿Cuál es el 
flujo más barato, sujeto a restricciones de capacidad? 


Una parte fascinante de este tema es el desarrollo de algoritmos. En vez de una demos- 


tración teórica de la dualidad, se usa primera búsqueda de amplitud o primera búsqueda 
de profundidad para encontrar la asignación Óptima o el flujo más barato. Es como el mé- 
todo simplex, ya que empieza con un flujo factible (un vértice) y suma un nuevo flujo (el 
desplazamiento hacia el siguiente vértice). Los algoritmos son especiales porque los pro- 
blemas de redes implican matrices de incidencia. 


La técnica de programación dinámica se apoya en un concepto simple: Si una ruta de 


una fuente a un sumidero es óptima, entonces cada parte de la ruta debe ser óptima. La 
solución es construir hacia atrás a partir del sumidero, en un proceso de decisión de etapas 
múltiples. En cada etapa, la distancia al sumidero es el mínimo de una nueva distancia más 
una distancia anterior: 


Ecuación de Bellman distancia x-f = mínimo sobre y de (distancias x-y + y-£). 


Me hubiese gustado tener más espacio sobre redes. Son simples y hermosas. 








Er Conjunto de problemas 8.4 

1. En la figura 8.5, sume 3 a cada capacidad. Por inspección, encuentre el flujo máximo 
y el corte mínimo. 

2. Encuentre un flujo máximo y el corte mínimo para la siguiente red: 

3. Sies posible incrementar la capacidad de cualquier tubo en la red de la figura anterior, 
¿qué cambio provocaría el mayor incremento en el flujo máximo? 

4. Trace una red de cinco nodos con capacidad |i — ¡| entre el nodo í y el nodo j. Encuen- 
tre el máximo flujo posible del nodo 1 al nodo 4. 

5. En una gráfica, el número máximo de rutas de s a f sin aristas comunes es igual al nú- 


mero mínimo de aristas cuya eliminación desconecta s de £. Relacione esto con el teo- 
rema del flujo máximo-corte mínimo. 








10. 


11. 


12. 


13, 


14. 


15. 


16. 
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Encuentre un conjunto máximo de matrimonios (un emparejamiento completo, de ser 
posible) para 


o O LU OOO 
lOs E DOSIS SO 
AO Ol y B=10.0 1.0 1 
000 O e 
00.010 000 000 


Trace la red para B, con líneas más gruesas en las aristas de los emparejamientos. 


Para la matriz A del problema 6, ¿qué renglones violan la condición de Hall al tener 
todos sus 1s en muy pocas columnas? ¿Qué submatriz de ceros de p por q cumple p + 
q > n? 


¿Cuántas rectas (horizontales y verticales) se requieren para cubrir todos los unos en 
la matriz A del problema 6? Para cualquier matriz, explique por qué la dualidad débil 
es cierta: si k matrimonios son posibles, entonces se requieren por lo menos k rectas 
para cubrir todos los 1s. 


a) Suponga que cada renglón y cada columna contienen exactamenten dos 1s. De- 
muestre que un emparejamiento completo es posible. (Demuestre que no es posi- 
ble cubrir los 1s con menos de » rectas.) 

b) Encuentre un ejemplo con dos o más 1s en cada renglón y cada columna, para el 
cual un emparejamiento completo es imposible. 


Si una matriz de 7 por 7 tiene 13 1s, demuestre que permite por lo menos tres matri- 
monios. 


Para conjuntos infinitos, un emparejamiento completo puede ser imposible incluso si 
se cumple la condición de Hall. Si todo el primer renglón es de 1s y entonces cada 
A;¡-1 = 1, demuestre que p renglones cualesquiera contienen 1s en por lo menos p co- 
lumnas; y ni así se tiene un emparejamiento completo. 


Si la figura 8.5 muestra longitudes en vez de capacidades, encuentre la ruta más corta 
de s a £, y un árbol generador mínimo. 


Aplique los algoritmos 1 y 2 para encontrar un árbol generador mínimo para la red del 
problema 2. 


a) ¿Por qué el algoritmo avaro es válido para el problema del árbol generador? 
b) Demuestre con un ejemplo que el algoritmo avaro podría fracasar en encontrar la 
ruta más corta de s a f, empezando con la arista más corta. 


Si A es la matriz de 5 por 5 con ls justo arriba y abajo de la diagonal principal, en- 
cuentre 


ay Un conjunto de renglones con 1s en muy pocas columnas. 
b) Un conjunto de columnas con 1s en muy pocos renglones. 
c) Una submatriz de ceros de p por q con p + q > 3. 

d) Cuatro rectas que cubran a todos los 1s. 


El problema de flujo máximo tiene variables flojas w;; = c¡; — x,¿ para la diferencia en- 
tre capacidades y flujos. Formule el problema de la figura 8.5 como un programa lineal. 
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8.5 TEORÍA DE JUEGOS E 


La mejor manera de explicar un juego de suma-cero de dos personas es mediante un ejem- 
Elo: ad dos jugadores X y Y, y las bi son las mismas en cada turno: 









; 2 - Matriz y del pagos | 
ps a ES 





Si X hace lo mismo cada vez, Y lo imitará y ganará. De manera semejante, Y no puede 
adherirse a una sola estrategia, o X hará lo contrario. Ambos jugadores deben usar una es- 
trategia mezclada, y la elección en cada turno debe ser independiente de los turnos pre- 
vios. Si hay algún patrón histórico, el oponente puede aprovecharlo. Incluso la estrategia 
“quedarse con la misma opción hasta perder” es evidentemente fatal. Luego de suficien- 
tes juegos, el oponente debe saber exactamente qué esperar. 

En una estrategia mezclada, X puede poner una mano con una frecuencia x, y ambas 
manos con frecuencia x, = 1 — x,. En cada turno, esta decisión es aleatoria. De manera se- 
mejante, Y puede escoger probabilidades y; y y, = 1 — y,. Ninguna de estas probabilida- 
des debe ser 0 o 1; en caso contrario, el oponente ajusta su estrategia y gana. Si son iguales 
a 3, Y perdería $20 muy a menudo. (Podría perder $20 la cuarta parte del tiempo, $10 otra 
cuarta parte del tiempo, y ganar $10 la mitad del tiempo, lo cual supone una pérdida me- 
dia de $2.50. Esto es más de lo necesario.) Pero mientras Y se mueve más hacia una estra- 
tegia pura de dos manos, más se moverá X hacia una mano. 

El problema fundamental es encontrar las mejores estrategias mezcladas. ¿X puede 
escoger probabilidades x, y x, que presenten a Y sin razón para moverse en su propia es- 
trategia (y viceversa)? Entonces el pago medio habrá alcanzado un punto silla: es máximo 
en tanto X esté preocupado, y es mínimo en tanto Y esté preocupado. Encontrar este punto 
silla es resolver el juego. 

X combina las dos columnas con pesos x, y 1 — x, para producir una nueva columna 
“mezclada”. Los pesos 5 y 5 deben producir esta columna: 


Colurana mezclada 2 =10 + a 20 = E ; 
5 10 5 |-10 2 


Contra esta estrategia mezclada, Y siempre pierde $2, ¡Esto no significa que todas las 
estrategias son óptimas para Y! Si Y es flojo y se queda con una mano, X cambiará y em- 
pezará a ganar $20. Luego Y cambiará, y luego también lo hará X. Finalmente, como se 
supone que ambos son inteligentes, se quedarán en estrategias mezcladas óptimas. Y com- 
binará los renglones con los pesos y; y 1 — y, tratando de producir un nuevo renglón que 
sea lo más pequeño posible: 


Renglón mezclado y, [ —10 20] +(1—y1) [10 —10] = [10— 20y, —10 + 30y, |. 


La mezcla correcta hace iguales a las dos componentes, en y; = 2. Luego, hace iguales a 
2 a ambas componentes; el renglón mezclado se vuelve [2 2]. Con esta estrategia Y no 
puede perder más de $2. 








Ejemplo 1 
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Y ha minimizado la pérdida máxima, y este minimax coincide con el maximin encontrado 
por X. El valor del juego es minimax = maximin = $2. 

¡La mezcla óptima de renglones puede no siempre tener elementos iguales! Suponga 
que a X se permite una tercera estrategia de mantener hasta tres manos para ganar $60 cuan- 
do Y pone una mano y $80 cuando Y pone hasta dos. La matriz de pagos se convierte en 


a= [10 20 60 
10 10  80|' 


X escogerá la estrategia de las tres manos (columna 3) cada vez, y ganará por lo menos $60. 
Al mismo tiempo, Y siempre escoge el primer renglón; la pérdida máxima es $60, Sigue 
teniéndose maximin = minimax = $60, pero el punto silla está en el vértice. 

En la mezcla óptima de renglones de Ys, que era puramente el renglón 1, $60 aparece 
sólo en la columna realmente utilizada por X. En la mezcla óptima de columnas de Xs, que 
era la columna 3, $60 aparece en el renglón que entra en la mejor estrategia de Ys. Esta 
regla corresponde exactamente a la condición floja complementaria de la programación 
lineal. 


Juegos matriciales 


El “juego matricial de m pór n” más general, es exactamente como nuestro ejemplo. X tie- 
ne n posibles movimientos (columnas de A). Y escoge de los »m renglones. El elemento a, 
está en la matriz de pagos cuando X escoge la columna j y Y escoge el renglón í. Un ele- 
mento negativo significa un pago a Y, Este es un juego de suma-cero. Lo que pierde un ju- 
gador lo gana el otro. 

X es libre de escoger cualquier estrategia mezclada x = (x;, ..., Xx). Éstos x, propor- 
cionan las frecuencias para las n columnas, cuya suma es 1. En cada turno, X utiliza un me- 
canismo aleatorio para producir la estrategia ¿ con frecuencia x;. Y escoge un vector y = 
Ot» > - «> Y), también con y,> 0 y 2y; = 1, que proporciona las frecuencias para seleccio- 
nar los renglones. 

Una simple jugada del juego es aleatoria. En promedio, la combinación de la colum- 
na / para X y del renglón ¡ para Y aparece con probabilidad x;y,. Cuando se presenta, el pa- 
go es aj, El pago esperado para X a partir de esta combinación es >>> 8:¡X/Y; = y Ax: 


X1 
aa 41 cc: din 
X2 
yAx =|y E rel : : : A = ayyy oc: 7 Amia Ya 
= Pago medio. 


Umi Am2 a Cmn 
n. 


Este es el pago yAx que X quiere maximizar y Y quiere minimizar. 


Suponga que A es la matriz identidad de n por n, A = [. El pago esperado se vuelve y/x = 
X1Y + o" + xp)yn- X espera encontrar la misma opción que Y, ganar as; = $1. Y está in- 
tentando evadir a X, pagar a, = $0. Si X escoge cualquier columna más a menudo que otra, 
Y puede escapar más a menudo. La mezcla óptima es x* =(1/n,1/n,..., 1/m). 
De igual manera, Y no puede preferir a ningún renglón, ya que la mezcla óptima es 
y* =(1/n,1/n,..., 1/n). La probabilidad de que ambos escojan la estrategia ¿ es (1/ ny, 
sumatoria sobre ¡es el pago esperado a X. El valor total del juego es n veces (1/n)”, o 
1/n: 
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Ejemplo 2 


1 ln 


q Ne IN 
yYax* =[ln --- Un] E psa) + +12) =>, 
E n n rn 


1 l/n 


Cuando n crece, Y tiene mejores posibilidades de escapar. El valor 1/n baja. 

La matriz simétrica A = Í no hizo justo el juego. Una matriz simétrica sesgada, A* = 
—A, significa un juego completamente justo. Así, una elección de la estrategia j por Xe i 
por Y gana a, para X, y la elección de ¡ por Y e i por X gana la misma cantidad para Y (por- 
que a; = —aj;). Las estrategias óptimas x" y y” deben ser las mismas, y el pago esperado 
debe ser y'Ax” = 0. El valor del juego, cuando 4* = —A, es cero. Aunque aún es necesa- 


rio encontrar la estrategla. 


1 E | 
Juego justo A=|1 0 
] 1 0 


En palabras, ambos X y Y escogen un número entre 1 y 3. La elección más pequeña gana 
$1. (Si X escoge 2 y Y escoge 3, el pago es 432 = $1; si escogen el mismo número, se es- 
tá en la diagonal y nadie gana.) Ningún jugador puede escoger una estrategia que implique 
2 0 3. Las estrategias puras x” = y” = (1, O, 0) son óptimas: ambos jugadores escogen 1 
cada vez. El valor es y Ax" = a, =0. 


La matriz que deja sin cambio a todas las decisiones tiene mn elementos iguales, por 
ejemplo «. Esto significa simplemente que X gana una cantidad adicional a en cada turno. 
El valor del juego se incrementa por «-, pero no hay razón para cambiar ax" y y”. 


El teorema minimax 


Póngase en el lugar de X, quien escoge la estrategia mezclada x = (x;,... , Xp). Y termina- 
rá por reconocer esa estrategia y escogerá y para minimizar el pago yAx. Un jugador inte- 
ligente X elegirá x” para maximizar este mínimo: 


X gana por lo menos mín y Ax* = máx mín yAx. (1) 
y A y 


El jugador Y hace lo contrario. Para cualquier estrategia elegida y, X maximizará yAx. 
En consecuencia, Y escogerá la mezcla y” que minimiza este máximo: 


Y pierde no más de máx y* Ax = mín máx y Ax. (2) 
x y E 


Espero que el lector se dé cuenta cuál será el resultado clave, si es cierto. Se quiere que 
la cantidad en la ecuación (1) que se garantiza que X ganará sea igual a la cantidad en la 
ecuación (2) que Y debe estar satisfecho de perder. Así se resolverá el juego: X puede ga- 
nar sólo moviéndose a partir de x” y Y puede perder sólo moviéndose a partir de y”. La exis- 
tencia de este punto silla fue demostrada por Von Neumamn. 
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En este punto silla, x” es por lo menos tan bueno como cualquier otro x (ya que y'Ax < 
y Ax). Y el segundo jugador Y sólo puede pagar más si abandona y”. 

Así como en la teoría de dualidad, maximin < miníimax es fácil. En la ecuación (1) se 
combina la definición de x”, y en la ecuación (2) se combina la definición de y”: 


máx mín yAx = mín yAx* < yFAx* < máx y*Ax = mínmáx yAx. (5) 
Xx $ y x y x 


Esto sólo afirma que si es posible garantizar que X gane por lo menos «e, y que Y pierda no 
más de 8, entonces a < É. El logro de Von Neumann fue demostrar que a = $, El teo- 
rema minimax significa que la igualdad debe cumplirse en toda la ecuación (5). 

Para nosotros, lo extraordinario sobre la demostración es que utiliza exactamente los 
mismos procedimientos matemáticos que la teoría de la programación lineal. X y Y desem- 
peñan roles “duales”. Ambos escogen estrategias del “conjunto factible” de vectores de 
probabilidad: x; > 0,9 x; = 1, y; > 0,» y; = 1. Lo emocionante es que incluso Von Neu- 
mann no reconoció de inmediato ambas teorías como la misma. (Demostró el minimax en 
1928, la programación lineal comenzó antes de 1947, y Gale, Kuhn, y Tucker publicaron 
la primera demostración de la dualidad en 1951, ¡con base en notas de Von Neumann!) Es- 
tamos invirtiendo la historia para deducir el teorema minimax a partir de la dualidad. 

En breve, el teorema minimax puede demostrarse como sigue. Sean b el vector colum- 
na de m 1s, y c el vector renglón de n 1s. Estos programas lineales son duales: 


minimizar Cx, maximizar yb, 
sujeto a Ax > b,x>0 sujeto a yA <c, y >0. 


Para tener la certeza de que ambos problemas son factibles, a todos los elementos de A se 
suma un gran número «a. Esto no puede afectar las estrategias óptimas, ya que cada pago 
asciende por «. Para la matriz resultante, que sigue denotándose por A, y = O es factible en 
el dual y cualquier x grande es factible en el original. 

El teorema de dualidad de programación lineal garantiza x" y y” óptimos con cx” = 
y b. Debido a los 1s que hay en b y en c, esto significa que YT x* = Y y* = S. La divi- 
sión entre S cambia las sumas a 1, y las estrategias mezcladas resultantes x"/S y y"/S son 
óptimas. Para cualesquiera otras estrategias x y y, 


Ax* >b implica yAx*>yb=1 y y*A<c implica y"Ax<cx=l. 


La cuestión más importante es que y*Ax < 1 < yAx*. Al dividir entre S, esto indica que 

el jugador X no puede ganar más que 1/S contra la estrategia y"/S, y que el jugador X no 

puede perder más que 1/S contra x”/S. Estas estrategias proporcionan maximin = mini- 
= 1/5. 





| 
| 
| 
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Juegos verdaderos 


Con esto se completa la teoría, aunque queda una pregunta natural: ¿Cuáles juegos norma- 
les son equivalentes a los “juegos matriciales”? El ajedrez, el bridge y el póquer, ¿se ajus- 
tan a la teoría de Von Neumann? 

Considero que el ajedrez no se ajusta muy bien, por dos razones. Una estrategia para 
las negras debe incluir una decisión de cómo contestar a la primera jugada de las blancas, 
a la segunda jugada y así sucesivamente hasta el final del juego. X y Y tienen millones de 
estrategias puras. No veo mucho sobre el papel del azar. Si las blancas pueden encontrar 
una estrategia ganadora, o si las negras pueden encontrar una estrategia inspirada ——ningu- 
na de estas posibilidades se ha descubierto— eso podría efectivamente terminar el juego 
del ajedrez. Puede jugarse como tic-tac-toe (gato), aunque la emoción se perdería. 

El bridge contiene algo decepcionante, como en un impasse. Se considera como un jue- 
go matricial, aunque de nuevo m y n son fantásticamente grandes. Quizá sea posible anali- 
zar parte por separado del bridge para encontrar una estrategia óptima. Lo mismo es válido 
para el béisbol, donde el pítcher y el bateador tratan de adivinar la elección del otro acerca 
del lanzamiento. (O bien el cátcher intenta adivinar cuándo el corredor se robará una base. 
Una “bola” cada vez otorga al bateador “base por bolas”, de modo que debe haber una fre- 
cuencia Óptima ——<dependiendo del corredor en base y de la situación.) De nuevo, una parte 
del juego puede aislarse para su análisis. 

Por otro lado, el blackjack no es un juego matricial (en un casino) porque sigue reglas 
fijas. Mi amigo Ed Thorp encontró una estrategia ganadora mediante el conteo de cartas al- 
tas, obligando a barajar más y más naipes en Las Vegas. No había ningún elemento de azar, 
y tampoco ninguna estrategia x”. El éxito editorial Bringing Down the House afirma cómo 
estudiantes del MIT ganaron bastante dinero (mientras no estaban haciendo sus deberes). 

También está el dilema del prisionero, en el que a dos cómplices se les ofrece por sepa- 
rado el mismo trato: confiesa y eres libre, en el supuesto de que tu cómplice no confiese (así, 
el cómplice obtiene 10 años de prisión). Si ambos confiesan, cada uno es condenado a 6 años 
de cárcel. Si ninguno confiesa, sólo es posible probar un delito menor (2 años de prisión a 
cada uno). ¿Qué hacer? La tentación por confesar es muy grande, aunque si pueden depen- 
der mutuamente, saldrían libres. Este no es un juego de suma-cero: ambos pueden perder. 

Un ejemplo de juego matricial es el póquer. La simulación o fingimiento (bluffing) es 
esencial, y para que sea efectiva debe ser impredecible. (Si su oponente descubre un pa- 
trón, usted está perdido). Las probabilidades en pro y en contra de fingir dependen de las 
cartas que estén a la vista, así como de las apuestas. De hecho, nuevamente el número de 
alternativas hace impráctico encontrar una estrategia absolutamente Óptima ax”. Un buen ju- 
gador de póquer debe aproximarse bastante ax”, y ésta puede calcularse exactamente si se 
acepta la siguiente simplificación enorme del juego: 


X recibe una jota o un rey, con igual probabilidad, y Y siempre recibe una reina. X puede 
pasar y perder la apuesta de $1, o subir la apuesta por $2 adicionales. Si X apuesta, Y pue- 
de pasar y perder $1, o pagar los $2 adicionales y averiguar si X está fingiendo. Luego, la 
carta más alta gana los $3 del oponente. Así, Y tiene dos posibilidades, en reacción a X 
(quien tiene cuatro estrategias): 


Estrategias (Renglón 1) Si X apuesta, Y pasa. 

para Y (Renglón 2) Si X apuesta, Y paga los $2 adicionales. 
Estrategias 1) Apostar los $2 adicionales al rey y pasar con una jota, 
para X 2) Apostar los $2 adicionales en cualquier caso (fingir). 


3) Pasar en cualquier caso, y perder $1 (lo cual es una tontería). 
4) Pasar con el rey y apostar con una jota (lo cual es una tontería). 
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Para calcular la matriz de pagos A se requiere un poco de paciencia: 


a1=0: X pierde $1 la mitad del tiempo en una jota y gana con un rey (Y pasa). 
da =1: En ambas apuestas X pierde $1 la mitad del tiempo y gana $3 la mitad 
del tiempo. 
4 = l: X apuesta y Y pasa (la simulación tuvo éxito). 
a4=0: X gana $3 con el rey y pierde $3 con la jota (el fingimiento fracasa). 
Matriz de pagos del póquer A = h : E lo 


La estrategia Óptima para X es fingir la mitad del tiempo, x* = (2, 3, 0, 0). El probable 
perdedor Y debe escoger y* = (2, 5). El valor del juego es 50 centavos para X. 


Esta es una forma extrañia de terminar este libro, enseñando cómo jugar un póquer sua- 


vizado (el blackjack paga mucho más). Sin embargo, me imagino que incluso el póquer tie- 
ne su sitio dentro del álgebra lineal y sus aplicaciones. Espero que haya disfrutado el libro. 


Conjunto de problemas 8.5 


1, 


¿De qué forma son afectadas las estrategias óptimas en el juego con que empieza esta 
sección si los $20 se incrementan a $70? ¿Cuál es el valor (la ganancia media para X) 
de este nuevo juego? 


Con la matriz de pagos A = E 2 , explique los cálculos por X del maximin y por Y 
del minimax. ¿Cuáles son las estrategias óptimas x” y y”? 


Si a es el mayor elemento en su renglón y el más pequeño en su columna, ¿A sierm- 
pre escogerá la columna j y Y siempre escogerá el renglón i (sin importar el resto de 
la matriz)? Demuestre que el problema precedente tenía tal elemento, y luego constru- 


ya Á sin uno. 


Calcule la mejor estrategia de Ys ponderando los renglones de A = E A | con 


y y 1 — y. X se centrará en la mayor de las componentes 3y + 2(1 — y), 4y y y + 
3(1 — y). Encuentre la más grande de estas tres (dependiendo de y), y luego encuen- 
tre la y” entre O y 1 que hace que esta componente sea lo más pequeña posible. 


Con la misma A que en el problema 4, encuentre la mejor estrategia para X. Demues- 
tre que X sólo usa las dos columnas (la primera y la tercera) que se encuentran en el 
punto minimax en la gráfica. 


Encuentre tanto las estrategias Óptimas como el valor, si 
1 0) 01 
dd E cal 3 
a b 


Suponga que Á = b al ¿Qué pesos x, y 1 — x, proporcionan una columna de la 


forma [u u]* y qué pesos y, y 1 — y, proporcionan un nuevo renglón [v v]? Demues- 
tre que u = VU. 


A A A A PR 


pa rn aii 
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8. Encuentre x”, y” y el valor v para 


5 


10. 


11. 


12. 


13: 


14. 


LE 0 0 
A=I0 2 50 
o 03 
Calcule 
mín máx —(x1)Yi + x2)2). 
y 20 xi 20 
Yyt+ty=1 a ex =1 


Explique cada una de las desigualdades en la ecuación (5). Luego, una vez que el teo- 
rema minimax la transforma en igualdades, deduzca (otra vez con palabras) las ecua- 
ciones del punto silla (4). 


Demuestre que x* = (3,3,0,0) y y* = (3, 3) son estrategias óptimas en nuestra 
versión simplificada del póquer, calculando yAx” y y"Ax, y comprobando las condicio- 
nes (4) para un punto silla. 


¿Ya se ha demostrado que ninguna estrategia de ajedrez hace ganar a las negras? Esto 
es ciertamente verdadero cuando se permite que los jugadores realicen dos movimien- 
tos a la vez; si las negras tienen una estrategia ganadora, las blancas podrían adelantar 
y retroceder un caballo y después seguir esa estrategia, llegando a la conclusión impo- 
sible de que ambos pueden ganar, 


Si X escoge un número primo y simultáneamente Y adivina si es par o impar (con ga- 
nancia o pérdida de $1), ¿quién tiene la ventaja? 


Si X es un mariscal de campo de fútbol americano, con la opción de correr o lanzar un 
pase, y Y puede defender contra una carrera o un pase, suponga que el pago (en yar- 
das) es 


a 2  8| defensa contra la carrera 
6 —6| defensa contra el pase. 


correr pasar 


¿Cuáles son las estrategias Óptimas y la ganancia media en cada jugada? 
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Imonacdó suma 
producto de espacios 


1. La intersección de dos espacios vectoriales 


Al considerar dos subespacios V y W en vez de sólo uno, surgen nuevas preguntas. Prime- 
ro se consideran los vectores que pertenecen a ambos subespacios. Esta “intersección” 
Y NW es un OS de estos pa 







Si V, y Wi son 1 subespacios de. un , espacio vectorial. también Jo es s su: 1 intersección. Peal 


pacio. a RS | 
Suponga que x y y son vectores que están en V y también en W. Debido a que Y y W 
son espacios vectoriales por derecho propio, x + y y cx están en V y en W. Los resultados 
de la suma y la multiplicación escalar también están en la intersección. 
Dos planos que pasan por el origen (o dos “hiperplanos” en R”) se cortan en un subes- 
pacio. La intersección de varios subespacios, o de un número infinito también es un 
subespacio. 


La intersección de dos subespacios ortogonales V y W es el subespacio Y MN W = (0) que 
consta de un solo punto. Sólo el vector cero es ortogonal a sí mismo. 


Suponga que Y y W son los espacios de matrices triangulares superior e inferior de n por 
n. La intersección Y MN W es el conjunto de matrices diagonales, que pertenecen a ambos 
subespacios triangulares. El resultado de sumar matrices diagonales, o de multiplicarlas por 
c, es una matriz diagonal. 


Suponga que Y es el espacio nulo de A y que W es el espacio nulo de B. Entonces V NM W 
es el menor espacio nulo de la matriz más grande C: 


Intersección de espacios nulos N(A)MN(B) es el espacio nulo de [ = pl 


Cx = O requiere tanto Ax = O como Bx = 0. Así, x tiene que pertenecer a ambos espacios 
nulos. 
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Ejemplo 4 


Ejemplo 5 


Ejemplo 6 


Íntersección, suma y producto de espacios 


2. La suma de dos espacios vectoriales 

Casi siempre, después de analizar la intersección de dos conjuntos, resulta natural estudiar 

su unión. Con espacios vectoriales esto no es natural. La unión Y U W de dos subespacios 

en general no es un subespacio. Si Y y W son el eje x y el eje y en el plano, los dos ejes 

juntos no son un subespacio. La suma de (1, 0) y (0, 1) no está en ninguno de estos ejes. 
Se desea combinar V y W. En vez de estudiar su unión, lo hacemos con su suma. 


DEFIMICIÓN Si V y W son subespacios de un espacio dado, también lo es su suma. V + 
W contiene a todas las combinaciones v + w, donde vu está en V y w está en W. 


V + VW es el menor espacio vectorial que contiene tanto a V como a W. La suma del 
eje x y del eje y es todo el plano x-y, como también lo es la suma de dos rectas distintas 
cualesquiera, sean perpendiculares o no. Si Y es el eje x y W es la recta x = y a 45”, en- 
tonces cualquier vector como (53, 3) puede separarse en v + w = (2, 0) + (3,3). Así, V + 
W es todo R?. | 


Suponga que V y W son complementos ortogonales en R”. Entonces su suma es V + W = 
R”. Todo x es la suma de sus proyecciones en V y W. 


Si V es el espacio de matrices triangulares superiores y W es el espacio de matrices trian- 
gulares inferiores, entonces V + W es el espacio de todas las matrices. Toda matriz de n 
por n puede escribirse como la suma de una matriz triangular superior y una matriz trian- 
gular inferior —de muchas formas, ya que las diagonales no están determinadas de mane- 
ra única. 

Estos subespacios triangulares tienen dimensión n(n + 1)/2. El espacio V + W de to- 
das las matrices tiene dimensión n?. El espacio V MN W de las matrices diagonales tiene di- 
mensión n. La fórmula (8) que se presenta a continuación se convierte en ni +n= nn + 
12 Fr 10/12: 


Si Y es el espacio columna de A y W es el espacio columna de B, entonces V + W es el 
espacio columna de la matriz más grande [A B]. La dimensión de V + W puede ser me- 
nor que las dimensiones combinadas de V y W (porque estos dos espacios podrían trasla- 
parse): 


Suma de espacios columna dim(V + W) = rango de [4 Bl. (6) 


El cálculo de Y MN W es más sutil. Para la intersección de espacios columna, un buen 
método consiste en poner bases de Y y W en las columnas de A y B. El espacio nulo de [A 
Bj conduce a Y NM W (consulte el problema 9). Estos espacios tienen la misma dimensión 
(la nulidad de [A B]). Al combinar con dim(V + W) se obtiene 


dim(V + W) + dim(V MN W) = rango de [A B]+ nulidad de [A BJ]. €) 


Se sabe que el rango más la nulidad (contando las columnas pivote más las columnas li- 
bres) siempre es igual al número total de columnas. Cuando [A B] tiene k + £ columnas, 
con k = dim Y y £ = dim W, se llega a una conclusión clara: 


+ Dimensión fórmula dim (V +W) +dim(V W)= dim ( 





Que no es una mala fórmula. El traslape de Y y W es Y MW. 
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3. Producto cartesiano de dos espacios vectoriales 


Si V tiene dimensión n y W tiene dimensión q, su producto cartesiano V X W tiene dimen- 
sión 1 + q. 





DEFINICIÓN V x W contiene a todas las parejas de vectores x = (v, w). 


Al sumar (v, w) a (v”, w”) en este espacio producto se obtiene (uv + v”, w + w”), y al mul- 
tiplicar por c se obtiene (cv, cw). Todas las operaciones en Y X W se realizan componen- 
te por componente. 


El producto cartesiano de R? y R? se parece bastante a R*. Un vector típico x en R? x R? 
es ((1, 2), (4, 6, 5)); un vector de R? y uno de R*. Esto se ve como (1, 2, 4, 6, 5) en R?. 

Los productos cartesianos están asociados de forma natural con las matrices en blo- 
que. De R” a RÍ se tienen matrices ordinarias de 5 por 5. En el espacio producto R? x R?, 
la forma natural de una matriz en bloque M de 5 por 5 es: 


E RaR? RiaR*]_[2por2 2por3] _|A B 
R?aR? RiaR 3 por2 3 por3 CD 

El resultado de la multiplicación de una matriz por un vector es (Av + Bw, Cv + Dv), lo 

cual no es muy fascinante, 


4. Producto tensorial de dos espacios vectoriales 


De alguna manera se quiere contar con un espacio producto cuya dimensión sea n multipli- 
cada por q. Los vectores en este “espacio tensorial” (que se denota por S), se parecen 
a las matrices de n por q. Para el producto tensorial R? £ R3, los vectores se parecen a las 
matrices de 2 por 3. La dimensión de R? x R? es 5, pero la dimensión de R? 8% R? es 6. 

Se empieza con v = (1, 2) y w = (4, 6, 5) en R? y R? El producto cartesiano simple- 
mente los aproxima mutuamente como (v, w). El producto tensorial combina a v y w en 
la matriz vw* de rango 1: 


Columna multiplicada ao 1 [4 6 AN 4 6 5 
por renglón Z SE O 


Todas las matrices especiales vw* pertenecen al producto tensorial R? Y RY. El espacio 
producto es generado por estos vectores v SY w. Las combinaciones de las matrices de ran- 
go 1 proporcionan todas las matrices de 2 por 3, por lo que la dimensión de R? Y R? es 6. 
En términos abstractos: el producto tensorial Y Y VW se identifica con el espacio de trans- 
formaciones lineales que van de V a W. 

Si V es sólo una recta en R? y V es sólo una recta en R”, entonces V Y W es sólo una 
“recta en el espacio de matrices”. Ahora las dimensiones son 1 X 1 = 1. Todas las matr1- 
ces vw! de rango 1 son múltiplos de una matriz. 


Bases del producto tensorial. Cuando V es R? y W es R?, se tiene una base estándar 
para todas las matrices de 2 por 3 (un espacio de seis dimensiones): 


Base (PO "QA OA O O UNO OA” AO O O 000 
0-00. 010: 0:05 Beso 0 o 0 O de 0 AO 00 LA 





| 
| 
| 
1 
i 
| 
| 


A EN A A 
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La base para R”? €% R” se construyó de forma natural. Se comenzó con la base estándar 

= (1,0) y uv, = (0, 1) para R”. Estos vectores se combinaron con los vectores básicos 
w, = (1, 0, 0), w, = (0, 1, 0) y wz = (0, 0, 1) en R?. Cada pareja v; SY w, corresponde a 
uno de los seis vectores básicos (las matrices de 2 por 3 de antes) en el producto tensorial 
V € W. Esta construcción también tiene éxito para subespacios: 


¿De Suponga. que Y Y. W: son n subéspacios de R”> y Re con. , bases De y LAA Va, Y We: | 
a: Entonces | las matrices na de rango — La Y, AE Sonstituyen u una a base para Ad Ed w. 


V SY W es un subespacio de dimensión nq de las matrices de m por p. Un algebrista haría 
corresponder esta construcción matricial con la definición abstracta de V Y W. Luego, los 
productos tensoriales pueden ir más allá del caso específico de los vectores columna. 


5. Producto de Kronecker A % B de dos matrices 


Una matriz A de m por n transforma cualquier vector y de R” en un vector Av de R”. De 
manera semejante, una matriz B de p por q transforma w en Bw. Las dos matrices juntas 
transforman vw” en Avw"B*. Esta es una transformación lineal (de productos tensoriales) 
y debe provenir de una matriz. 

¿Cuál es el tamaño de la matriz A Y B? Ésta lleva el espacio ng-dimensional 
R” % R? en el espacio mp-dimensional R” $ R?. En consecuencia, la forma de la matriz 
es de mp por nq. Este producto de Kronecker que también se denomina producto tensorial) 
se escribe 


K au B ay B pde G15 13 

Producto de Kronecker mp daB deb <<. ab 

renglones, ng columnas 480B= . (9) 
dm: B Am2 B o Amn B 


¡Observe la estructura especial de esta matriz! Muchas matrices en bloque importantes tie- 
nen esta forma de Kronecker. Aquéllas provienen de aplicaciones bidimensionales, donde 
A es una “matriz en la dirección x” y B actúa en la dirección y (a continuación se propor- 
cionan algunos ejemplos). Si A y B son cuadradas, también lo son m = n y p = q, enton- 
ces la matriz grande A Y B también es cuadrada. 


(Diferencias finitas en las direcciones x y y) La ecuación diferencial original de Laplace 
—9u/9 x? —3?*u/09 y? = 0 se sustituye por diferencias finitas a fin de encontrar valores pa- 
ra u en una malla bidimensional. Las diferencias en la dirección x se suman a las diferen- 
cias en la dirección y, uniendo cinco valores vecinos de u: 





K—4— 8 —1 e-—1 

-l 2 —i 4 9 —1 O Ups E DU Us 
— Ur j4r E ZU j — Ut 

E y e =0 


diferencias-x diferencias-y suma 


$ 
MN 
8 
Ml 
ERA 
a 
| 





NANO da 
Ms PONER: AO Ae 
A INS AN 
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Una ecuación de 3 puntos está centrada en cada uno de los nueve puntos de la malla. La 
matriz de 9 por 9 (que se denomina Ap) se construye a partir de la matriz “1D” de 3 por 
3 para las diferencias a lo largo de una recta: 


Matriz de diferencias 5 2 —1 0 | Matriz identidad Lo 00 
en una dirección e ñe > 711 en otra dirección /“ ; . , 


Los productos de Kronecker producen tres diferencias 1D a lo largo de tres rectas, ha- 
cia arriba o transversales: 


alo =L 0 

Una dirección AQl=i¡-I 21 -—Il 
e E 

A 0 0 
Otra dirección IGA=|0 A 04. 

0 0 A 

A +2] =E 0 
Ambas direcciones Az =(A8/)+(19 A) = 7d A NHZE e A 
0 ==] A +21 


La suma (A Y 7) + (17 O A) es la matriz de 9 por 9 de Laplace para la ecuación en dife- 
rencias de 3 puntos (en la sección 1.7 era para 1D y en la sección 7.4 se mencionó a 2D). 
El renglón de en medio de esta matriz de 9 por 9 muestra todos los cinco elementos dife- 
rentes de cero para la molécula de 5 puntos: 


Lejos de la frontera  Renglón 5 de A7p =[0 -1 0  —-14-—1 0 —1 oO 


(Matriz de Fourier en 2D) La matriz unidimensional F de Fourier es la matriz compleja 
más importante en el mundo. La Transformada Rápida de Fourier en la sección 3.5 es una 
forma rápida para multiplicar por esa matriz F. Así, la TRF transforma el “dominio tempo- 
ral en el dominio de frecuencias” para una señal de audio en 1D. Para imágenes, se re- 
quiere la transformada 2D: 


Se transforma a lo largo de cada renglón, 


Matriz de Fourier en 2D F,p =F 8 F = y luego hacia abajo de cada columna 


La imagen es un arreglo bidimensional de valores de pixeles. Es transformada por F2p en 
un arreglo bidimensional de coeficientes de Fourier. Este arreglo puede comprimirse, trans- 
mitirse y almacenarse. Luego, la transformada inversa regresa de los coeficientes de Fou- 
rier a los valores de pixeles. Es necesario conocer la regla inversa para los productos de 
Kronecker: 


La inversa de la matriz A Q B es la matriz AT! B7?. 


¡La TRE también acelera la transformada inversa 2D! Simplemente se invierte en una di- 
rección seguida de la otra dirección. Se está sumando 37 3” cygel ells sobre k y luego so- 
bre £. 

La matriz de diferencias de Laplace Ap =(A 9 1) + (Y Q A) no tiene una fórmu- 
la inversa sencilla. Es por ello que la ecuación Azpu =b ha sido estudiada con tanto cui- 
dado. Uno de los métodos más rápidos es diagonalizar Ap usando la matriz de vectores 
característicos (que es la matriz seno S 6) S de Fourier, muy semejante a A2p). Los valo- 
res característicos de A>p provienen inmediatamente de los valores característicos de Á ¡p: 
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Los n? valores característicos de (A 9 1) + (19 B) son todas las sumas A¿(A) +A ¿UB 
Los n? valores característicos de A Y B son todos los productos A¿(AJA AB). 


S1 A y B son de n por n, el determinante de 4 Y B (el producto de sus valores característi- 
cos) es (det A)*(det B)”. La traza de A Y B es (traza A)ítraza B). ¡En este apéndice se ilus- 
tran tanto el “álgebra lineal pura” como sus aplicaciones cruciales! 


Conjunto de problemas A 


1, 


Suponga que $ y T son subespacios de R”, con dim S = 7 y dim T = 8. 


a) ¿Cuál es la máxima dimensión posible de S N T? 
b) ¿Cuál es la mínima dimensión posible de S N T? 

c) ¿Cuál es la mínima dimensión posible de S + T? 
d) ¿Cuál es la máxima dimensión posible de S + T? 


¿Cuáles son las intersecciones de las siguientes parejas de subespacios? 


a) El plano x-y y el plano z-y en R?. 

by) La recta que pasa por (1, 1, 1) y el plano que pasa por (1, 0, 0) y (0, 1, 1). 
c) El vector cero y todo el espacio R?. 

d) El plano S perpendicular a (1, 1, 0) y (0, 1, 1) en R?. 


¿Cuáles son las sumas de estas parejas de subespacios? 


En el espacio de todas las matrices de 4 por 4, sea V el subespacio de las matrices 
tridiagonales y W el subespacio de las matrices triangulares superiores. Describa el 
subespacio V + W, cuyos elementos son las matrices superiores de Hessenberg. 
¿Cuál es Y NM W? Compruebe la fórmula (8). 


Si V N W contiene sólo al vector cero, entonces la ecuación (8) se convierte en dim(V 
+ W) = dim V + dim W. Compruebe este hecho cuando Y es el espacio renglón de 
A, W es el espacio nulo de A y la matriz A es de mm por n de rango r. ¿Cuáles son las 
dimensiones? 


Proporcione un ejemplo en R? para el que V N W contiene sólo al vector cero, pero V 
no es ortogonal a W. 


Si V NW = (0), entonces V + W se denomina suma directa de Y y W, con la nota- 
ción especial Y Y W. Si Y es generado por (1, 1, 1) y (1, 0, 1), escoja un subespacio 
W de modo que V 8 W = R?. Explique por qué cualquier vector x en la suma direc- 
ta V Y W puede escribirse de una y sólo una forma como x = vu + w (con ven V y 
wen W). 


Encuentre una base para la suma Y + W del espacio V generado por v, = (1, 1, 0, 0), 
va = (1, 0, 1, 0) y el espacio W generado por w, = (0, 1,0, 1), w, = (0, 0, 1, 1). Tam- 
bién encuentre la dimensión de V N W y una base para éste. 


A. partir de la ecuación (8), demuestre que rango (4 + B) < rango(4) + rango(B). 


La intersección de C(4) N C(B) coincide con el espacio nulo de [A BJ]. Cada y = 
Ax, = Bx, en los espacios columna tanto de A como de B coinciden con x = (x,, —x2) 
en el espacio nulo, porque[ A Blx = Ax, — Bx, = 0. Compruebe que y = (6, 3, 6) 








10. 


11. 


12. 


13 


s 
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coincide con x = (1, 1, —2, —3) y encuentre la intersección C(4) N C(B), para 


1: 3-0 
A=1|3 0 Boo pUs lo 
2 4 o 2 


Multiplique A 9 Bpor A”? 8 B7? para obtener AA7!' 9 BB" =108 1 = hp. 


¿Cuál es la matriz de Fourier de 4 por 4 F»y =F OF para F = E AV 


Suponga que Áx = A(4)x y By = A(B)y. Forme un vector columna largo z con n? 
componentes, x,y, luego x,y y por último x,, y. Demuestre que z es un vector caracte- 
rístico de (49 /)z =A(A)J y (409 BB) = ACA( BIZ. 


¿Cuál debe ser la matriz de Laplace de Y puntos para —4 xy — Uyy — U¿¿ = 07 Esta 
matriz “tridimensional” se construye a partir de productos de Kronecker usando / y 
Ap: 





AAA 
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La forma de Jordan 


Dada una matriz cuadrada A, se quiere escoger M de forma que M”!AM sea lo más diago- 
nal posible. En el caso más sencillo, A tiene un conjunto completo de vectores caracte- 
rísticos que se convierten en las columnas de M, conocida como S. La forma de Jordan es 
J= MT AM = A; se construyó completamente a partir de bloques J, = A¿de 1 por 1, y el 
objeto de una matriz diagonal se ha alcanzado por completo. En el caso más general y di- 
fícil, faltan algunos vectores característicos y una forma diagonal es imposible. Ese caso 
constituye ahora nuestro principal interés. 
Se di el teorema que debe demostrarse: 

de, Siv una matriz A tiene's vectores A linealmente independientes, entonces. e 
eS serpiente a una : matriz zi mue. es se e e Jordan, con s A cuadrados e co 
E le diagongE da a ee ES te] SS 





E ES bloque £ tiene y un 1 vector r característico, un. 2. valor, característico y unos s justo. arri- a 





Un ejemplo de esta forma de Jordan es el siguiente: 


E A O IA O A 8 1 F, 

DS 0075070 O $8 

0-00 0070 0 o! 

SIA O AE 8 ION 0 0) [0] F, 
El valor característico doble A = 8 sólo tiene un simple vector característico, en la prime- 
ra dirección de coordenadas e, = (1, 0, O, O, 0); como resultado, A = 8 sólo aparece en un 


simple bloque J,. El valor característico triple A = O tiene dos vectores característicos, ey 
y es, que corresponden a los dos bloques de Jordan J, y Jz. Si A tuviese 5 vectores carac- 
terísticos, todos los bloques serían de 1 por 1 y J sería diagonal. 

La pregunta clave es: Si A es alguna otra matriz de 53 por 5, ¿en qué condiciones su 
forma de Jordan sería esta misma J? ¿Cuándo existe una M tal que M”|AM = J? Como 
primer requerimiento, cualquier matriz semejante A debe compartir los mismos valores ca- 
racterísticos 8, 8, O, O, O. Sín embargo, la matriz diagonal con estos valores característicos 
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no es semejante a f, y la pregunta planteada en realidad concierne a los vectores caracte- 
rÍSticos. 
Para contestar, M”"*AM = J se escribe en forma más simple como AM = MJ]: 


| 
o 8 
ALEXA. XA. ALS A a óÓ 1 
O 0 
0 
Al efectuar la multiplicación columna por columna, 
Áx] = 8x1 y Áxs > 8x2 261 (10) 
Ax3=0x3 y  Axa=0x4+x3 y  Axs=0xs. UI) 


Ahora es posible reconocer las condiciones sobre A, Debe tener tres vectores característicos 
genuinos, así como J. El que cumple A = $ debe ir en la primera columna de M, exactamen- 
te como si hubiese ido en la primera columna de S: Ax, = 8x,. Los otros dos, que se identi- 
fican como x3 y xs, van en las columnas tercera y quinta de M: Ax, = Axs = 0. Por último, 
debe haber otros dos vectores especiales: los vectores característicos generalizados X2 Y Xy. 
Se considera que x, pertenece a una cadena de vectores, encabezados por x, y descrita por 
las ecuaciones (10). De hecho, x, es el único otro vector en la cadena, y el bloque J, corres- 
pondiente es de orden 2. La ecuación (11) describe dos cadenas distintas, una en la que xy si- 
gue a x3, y otra en la que xs está solo: los bloques J, y J3 son de 2 por 2 y de 1 por 1. 

La búsqueda de la forma de Jordan de A se convierte en la búsqueda de estas cade- 
nas de vectores, cada una encabezada por un vector característico: Para toda i, 


Ya sea AX; = AX; Obien, Ax; = A¡X¡ + Xj-1. (12) 


Los vectores x, van en las columnas de M, y cada cadena produce un simple bloque en J. 
Esencialmente, es necesario demostrar que estas cadenas pueden construirse para cada ma- 
triz A. Entonces, si las cadenas coinciden con las ecuaciones particulares (10) y (11), la J 
obtenida será la forma de Jordan de A. 

Considero que la idea de Filippov hace de la construcción lo más clara y sencilla po- 
sible.” Procede por inducción matemática, empezando con el hecho de que toda matriz de 
l por 1 ya está en forma de Jordan. Puede suponerse que la construcción se logra para to- 
das las matrices de orden menor que n —<esta es la “hipótesis de inducción”-—- y luego ex- 
plicar los pasos para una matriz de orden n. Hay tres pasos, que después de una descrip- 
ción general se aplican a un ejemplo específico. 


Paso 1  $Sise supone que Á es singular, entonces su espacio columna tiene dimensión 
r < n. Observando sólo dentro de este espacio más pequeño, la hipótesis de inducción 
garantiza que una forma de Jordan es posible: en el espacio columna debe haber r vec- 
tores independientes w; tales que 


ya sea Aw; = A¿w; o bien, Áv; = A¡W; T Wj-1. as) 


Paso 2 Suponga que el espacio nulo y el espacio columna de A tienen una intersec- 
ción de dimensión p. Por supuesto, todo vector en el espacio nulo es un vector carac- 
terístico correspondiente a A = O. Por consiguiente, en el paso 1 debe haber p cadenas 
que comenzaron en este valor característico, y se tiene interés en los vectores ww, que 


* A. E Filippov, A short proof of the reduction to Jordan form, Moscow Univ. Math. Bull., 
volume 26(1971) pp. 70-71, 


A 
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vienen al final de estas cadenas. Cada uno de estos p vectores está en el espacio co- 
lumna, por lo que cada uno es una combinación de las columnas de Á: w, = Ay; para 
alguna y,. 

Paso 3 La dimensión del espacio nulo siermpre es n — r. En consecuencia, de forma 
independiente con respecto a su intersección p-dimensional con el espacio columna, 
debe contener n — r — p vectores básicos adicionales z, fuera de esa intersección. 


A continuación se reúnen estos pasos para obtener el teorema de Jordan: 





Sis se esca renumerar estos vectores COMO Xy, .. ., Xp y On: A Siasida con la ecua- 
ción (12), entonces cada y, debe insertarse de ¡amediaro después del w, del que provino; 
completa una cadena en la que A, = O. Las zs vienen hasta el final, cada una sola en su 
propia cadena; de nuevo el valor característico es cero, ya que las zs están en el espacio 
nulo. Los bloques con valores característicos diferentes de cero ya se habían terminado en 
el paso 1, los bloques con valores característicos cero aumentan por un renglón y una co- 
lumna en el paso 2 y el paso 3 contribuye con cualesquiera bloques de 1 por 1 J; = [0]. 

A continuación se intentará trabajar un ejemplo, y a fin de permanecer próximo a las 
páginas previas, los valores característicos se toman como 8, 8, 0, O, O: 


e "UDS 8 
0-20 003 90 
A=]0 0 0.0 0 
Oi 0030 50:09 
LA O EN 0 ALO 


Paso 1 La dimensión del espacio columna es r = 3, y es generado por los vectores de 
coordenadas e,, €, €s. Para buscar dentro del espacio se ignoran los renglones terce- 
ro y cuarto y las columnas de A, lo que queda tiene valores característicos 8, 8, O y su 
forma de Jordan proviene de los vectores 


wa Y3 


8 
! 
GuO- O SO .00 
Il 
pá OY O O 
tl 
Gr E O 05 


Los w, están en el espacio columna, completan la cadena para A = 8 e inician la ca- 
dena parad = 0: 


Aw;, = 8w,, Áwo: = 8wz + wi, Aw3 = 0wz. (14) 


Paso 2 El espacio nulo de A contiene a e, y ez, por lo que su intersección con el espa- 
cio columna es generada por ez. Por consiguiente, p = 1 y, como era de esperar, en la 
ecuación (14) hay una cadena correspondiente a A = O. El vector w3x viene al final (y 
también al principio) de esa cadena, y W¿ = A(e¿ — €e,). En consecuencia, y = €4 — €j- 
Paso 3 El ejemplo tiene n —- r— p=5-—3-—1= 1, y z = ey está en el espacio nu- 
lo pero fuera del espacio columna. Es esta z la que produce un bloque de 1 por 1 en J. 
Si los cinco vectores se ensamblan, las cadenas completas son 


AÁw; == SUI, AÁwoa > 3102 HE Wi, Av Sa 0w»z, Ay us Oy e U73, Az = Oz. 











Ejemplo 1 
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Al comparar con las ecuaciones (10) y (11), se tiene una correspondencia perfecta: la for- 
ma de Jordan del ejemplo es exactamente la J que se escribió previamente. Al escribir los 
cinco vectores en las columnas de MM debe obtenerse AM = MJ, o bien, M”*4M =J: 


9-00 00 LO 
UUECES 0-0 
M=|0 0 0 E 
00. 0 1 6 
1 EN 8. 0 0 


Confiamos bastante en las matemáticas (o somos demasiado flojos), por lo que no multi- 
plicamos M”*AM. 

En la construcción de Filippov, la única cuestión técnica es comprobar la independen- 
cia de toda la colección w,, y, y z,, En consecuencia, se supone que alguna combinación es 


cero: 
Y aw + Y dy +) 814 =0. (15) 


Al multiplicar por A, y usar las ecuaciones (13) para las w,, así como Az, = 0, 


Aj vw; 
o €; o bien, + 0 d,¡Ay; =0. (16) 


A¿W; TF Wim1 


Las Ay, son las w, especiales al final de las cadenas correspondientes a A, = 0, de modo que 
no pueden aparecer en la primera suma. (Están multiplicadas por cero en A/Ww;,) Debido a 
que la ecuación (16) es alguna combinación de las 1,, que por la hipótesis de inducción eran 
independientes —proporcionaban la forma de Jordan en el espacio columna— se concluye 
que cada d, debe ser cero. Volviendo a la ecuación (15), esto deja Y c,w, = — 2,2, y el 


miembro izquierdo está en el espacio columna, Debido a que las zs eran independientes de 
ese espacio, cada g, debe ser cero. Por último, Y” c¡w, =0 y la independencia de las w, 
produce c; = O. 

Si la A original no hubiese sido singular, entonces los tres pasos se hubieran aplicado 
a A! = A — cl. (La constante c se escoge para hacer singular a A”, y puede ser cualquiera 
de los valores característicos de 4.) El algoritmo pone A' en su forma de Jordan M”!4'M 
= J' al producir las cadenas x, a partir de las W,, y; y Z,, Luego, la forma de Jordan para A 
utiliza las mismas cadenas y la misma M: 

M*AM=MTUAMA+MOCM=J +cl=J. 

Con esto se completa la demostración de que toda 4 es semejante a alguna matriz de Jor- 
dan /. Salvo un reagrupamiento de los bloques, es semejante sólo a una J así; hay una for- 
ma de Jordan única para A. Así, el conjunto de todas las matrices se separa en una cantl- 
dad de familias con la siguiente propiedad: todas las matrices de la misma familia tienen 
la misma forma de Jordan, y todas son semejantes entre sí (y a J), pero ningunas matrices 
pertenecientes a familias distintas son semejantes. En cada familia, J es la más hermosa, 
en caso de que a usted le agrade que las matrices sean casi diagonales. Con esta clasifica- 
ción de familias terminamos. 


con A =0,0,0. 


> 
! 
O. 0 
OO 
O - »N 





AS 





A 
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Esta matriz tiene rango r = 2 y sólo un vector característico. Dentro del espacio columna 
hay una sola cadena w;,, 4, que coincide con las dos últimas columnas: 


1 Z 1 
AjO| =0 y A|1j = POl, 
0 0 0 
O bien, 
Áwi = 0 dl Au» = 0w e UU 


El espacio nulo está completamente dentro del espacio columna, y es generado por wy. En 
consecuencia, p = 1 en el paso 2, y el vector y proviene de la ecuación 


2 0 
Ay=w=|]l!, cuya solución es y=|¡0l. 
0 1 


Finalmente, la cadena w,, w», y va en la matriz M: 


1 50 0.10 
M=|0 1 0l, y MLAM=.(00.:0 TT l=F 
0 0-1 0.0.0 


> oe 


Aplicación a du/dt = Au 


Como siempre, el problema se simplifica separando las incógnitas. Esta separación está 
completa sólo cuando hay un conjunto completo de valores característicos y u = Sv; el me- 
jor cambio de variables en este caso es u = Mv. Esto produce la nueva ecuación M du/dt 
= AMv, o du/d: = Jv, que es lo más simple como permiten las circunstancias. Está acopla- 
da sólo por los 1s fuera de la diagonal dentro de cada bloque de Jordan. En el ejemplo pre- 
cedente, que tenía un solo bloque, du/dt = Au se convierte en 


da 0.110 dal dt =b a=a4a) + bot + cot?/2 
5 =|0 O liv  obien, db/dt=c o bien, b= bo + Cot 
¿ DU Os +0 del dt =0 c= Co: 


El sistema se resuelve trabajando hacia arriba a partir de la última ecuación, y en cada pa- 
so entra una nueva potencia de £. (Un bloque de £ por £ tiene potencias tan altas como 
¿*71). Las exponenciales de J, en este caso y en el ejemplo anterior de 5 por 5, son 


er 1% 00.0 
A e E 00 e 000000 
en On y 0 0 ESE 0 
0 0 1 0 O 00-150 
0 00500 


Puede verse cómo los coeficientes de a, b y c aparecen en la primera exponencial. Y en el 
segundo ejemplo es posible identificar a todas las cinco de las “soluciones especiales” de 
du/dt = Au. Tres de ellas son las exponenciales puras y ¡> ex, us = ex y us = 
e xs, formadas como de costumbre a partir de los tres vectores característicos de A. Las 
otras dos implican los vectores característicos generalizados x, y Xa: 


uy += e O, y Ha: = e (tx; a): (17) 
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La solución más general de du/dt = Au es una combinación de cu; + ++ +csus, y la 
combinación que coincide con uy en el instante £ = O de nuevo es 


Uy = C1xi +++ +esxs, obien us = Mc, obien c=M"luo. 


Esto sólo significa que u = Me” M”! ug, y que la S y la A en la fórmula anterior Se%* $71 yy 
se han sustituido por M y J. 





Conjunto de problemas B 


1. Encuentre las formas de Jordan (¡en tres pasos!) de 


do as: 
al y B=|0 0 Ol 
0.0.0 


2. Demuestre que la solución especial u, en la ecuación (17) satisface du/d: = Au, exac- 
tamente debido a la cadena Ax, = 8x1, Ax2 = 8x2 + x1- 


3. Para la matriz B en el problema 1, use Me?*' M7”! para calcular la exponencial e**, y 
compárela con la serie de potencias ] + Bt + (B*/12!1 +++». 


4. Demuestre que cada bloque de Jordan J, es semejante a su traspuesta, J? =P"! JP, 
usando la matriz permutación P con 1s a lo largo de la diagonal cruzada (de la parte 
inferior izquierda a la parte superior derecha). Concluya que toda matriz es semejante 
a su traspuesta. 


5. “Por inspección”, encuentre las formas de Jordan de 
EA 1 y 
4=|0 4 5 y B= los Sl | 
0. 0.56 


6. Encuentre la forma de Jordan J y la matriz M para A y B (Los valores característicos 
de Bson 1, 1, 1, —1). ¿Cuál es la solución de du/dt = Au, y cuál es el? 


00051 50:50 o DS 

0.0 0 10 O E 

A=|0 0 0 0 1 y B= 

2. 1-1 1 

A o 
0.0. D:0.0 


7. Suponga que A? = A. Demuestre que su forma de Jordan J = M7!*AM satisface 
J? = J. Ya que los bloques diagonales permanecen separados, esto significa que 
J? = J, para cada bloque; demuestre por cálculo directo que /, sólo puede ser un blo- 
que de 1 por 1, J, = [0] o J, = [1]. Así, A es semejante a una matriz diagonal de Os y 
Ís: 


Nota Este es un caso típico del teorema con que terminamos: la matriz A puede diagonali- 
zarse si y sólo si el producto (A — MDNA — A21)---(A — Apl), sin incluir ninguna repe- 
tición de los As, es cero. Un caso extremo es una matriz con valores característicos distintos; 
el teorema de Cayley-Hamilton establece que con n factores, A — Al siempre se obtiene ce- 
ro. El otro extremo es la matriz identidad, también diagonalizable (p = 1 y A — [1 = 0). La 

matriz no diagonalizable A = E Al no satisface (4 — 7) = O, sino sólo (A — [ = 0*: una 


ecuación con una raíz repetida. 


A A 
7 


A AAA A E 
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Conjunto de problemas 1.2, página 9 


Lo 
dl 


Y JJ Y 


11. 


13, 


15, 


1 


19. 


21. 


PON 


Las rectas se cortan en (x, y) = (3, 1). Así, 3(colunma 1) + 1(columna 2) = (4, 4). 
Estos “planos” se cortan en una recta en el espacio tetradimensional. El cuarto plano 
normalmente corta esta recta en un punto. Una ecuación inconsistente como 4 + w = 
5 no deja solución (no hay intersección). 


. Los dos puntos sobre el plano son (1, 0, 0, 0) y (0, 1, 0, 0). 
. Resoluble para (3, 5, 8) y (1, 2, 3); no resoluble para b = (3,5, 7) o b = (1, 2, 2). 
. Columna 3 = 2(columna 2) — columna 1. Si b = (0, O, 0), entonces (1, y, W) = 


(6287). 

Tanto a = 2 y a = —2 proporcionan una recta de soluciones. Todas las demás a pro- 
porcionan x = 0, y =0, 

La representación de los renglones tiene dos rectas que se encuentran en (4, 2). La re- 
presentación de las columnas tiene 4(1, 1) + 2(—2, 1) = 4(columna 1) + 2(columna 
2) = miembro derecho de (0, 6). 

La representación de los renglones muestra cuatro rectas. La representación de las co- 
lumnas está en el espacio tetradimensional. No hay solución a menos que el miembro 
derecho sea una combinación de las dos columnas. 

Six, y, z satisfacen las dos primeras ecuaciones, también satisfacen la tercera ecuación. 
La recta 1L de soluciones contiene a v = (1,1,0),w = (3, ¡Es 2) yu = 5U + 3w, 
así como a todas las combinaciones cv + dw conc +d= 1. 

Columna 3 = columna 1; soluciones (x, y, z) = (1, 1,0) 0(0, 1, 1) y es posible sumar 
cualquier múltiplo de (— 1, 0, 1); b = (4, 6, c) necesita c = 10 para resolubilidad. 

Se cambian el segundo plano, el renglón 2 y todas las columnas de la matriz. La solu- 
ción no cambia. 

u =0,v = 0, w = 1, porque l(columna 3) = b. 


Conjunto de problemas 1 de o 15 


E 


3 


11. 


Se multiplica por £ =  = 5 y se resta para encontrar 2x + 3y = 1 y —6y = 6. Los 
pivotes son 2 y —6 
Se resta —3 veces la ecuación 1 (o se suma z veces la ecuación 1). La nueva segunda 


ecuación es 3y = 3, Así, y = 1 y x= 5. Si el miembro derecho cambia de signo, tam- 
bién lo hace la solución: (x, y) = (—3, —1). 


. Óx + 4yes 2 veces 3x + 2y. No hay solución, a menos que el miembro derecho sea 


2: 10 = 20. Por tanto, todos los puntos sobre la recta 3x + 2y = 10 son soluciones, 
incluyendo a (0, 5) y (4, —1), 

Si a = 2, la eliminación debe fallar. Las ecuaciones no tienen solución. Si a = O, la 
eliminación se detiene para un intercambio de renglones. Así, con 3y = —3 se obtie- 
ne y = —1 y con 4x + 6y = 6 se obtiene x = 3. 


. Óx — 4yes 2 veces (3x — 2y). Por consiguiente, se necesita b, = 2b,. Entonces hay una 


infinidad de soluciones. Las columnas (3, 6) y (—2, —4) están sobre la misma recta. 

2x — 3y=3 pro- 2x-—3y=3 x=3 Del renglón 2 se resta 2 X renglón 1 
y+ z=1 po- y+ z¿=1 y y=1 Del renglón 3 se resta 1 X renglón 1 

2y — 32 =2 ciona Tiz=0 z¿=0 Delrenglón 3 se resta 2 X renglón 2 














13: 


15 


4 de 


19, 


21. 


23. 


25 


2h 


29. 


31. 
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La segunda posición pivote contiene a —2 — b.Sib = —2, se intercambia con el ren- 
glón 3. Sib = —1 (caso singular), entonces la segunda ecuación es —y — z = 0. Una 
solución es (1, 1, —1). 

Si renglón 1 = renglón 2, entonces el renglón 2 es cero después del primer paso; se 
intercambia el renglón cero con el renglón 3 y no hay tercer pivote. Si columna 1 = 
columna 2, no hay segundo pivote. 

El renglón 2 se convierte en 3y — 4z = 5; luego, el renglón 3 se convierte en (q + 
417 = t— 35.Siq = —4, el sistema es singular; no hay tercer pivote. Luego, sit = 5, 
la tercera ecuación es O = 0. Al escoger z = 1, la ecuación 3y — 4z = 5 proporciona 
y = 3 y la ecuación 1 proporciona x = —9. 

El sistema es singular si el renglón 3 es una combinación de los renglones 1 y 2. Des- 
de la vista extrema, los tres planos forman un triángulo. Esto ocurre si los renglones 
1 + 2 = renglón 3 en el miembro izquierdo pero no en el miembro derecho; por ejem- 
plo, x+y+2Z2=0,x— 2y-— 2=1,2x — y = 9. Ninguna pareja de planos es para- 
lela, aunque sigue no habiendo solución. 

El quinto pivote es a. El n1-ésimo pivote es a 


Dos UN INS" PL u= 3 
Sistema triangular 2u + 2w = 2 Solución v = —2. 
zw = 2 w= 1 


(u,v,w) = (3/2, 1/2, —3). Se cambia a +1 para que el sistema sea singular (2 co- 
lumnas iguales). 

= (O requiere un intercambio de renglones, pero el sistema es no singular: a = 2 lo 
hace singular (un pivote, infinidad de soluciones); a = —2 lo hace singular (un pivo- 
te, no hay solución). 
El segundo término bc + ades [a + bKc + d) — ac — bd (sólo una multiplica- 
ción adicional). 
La eliminación falla para a = 2 (columnas iguales), a = 4 (renglones iguales), a = O 
(columna de ceros). 


Conjunto de problemas 1.4, página 26 


3. 


e 


y 


9. 


17 5 
41, 1-21, Al Con lados (2, 1) y (0, 3), el paralelogramo va a (2, 4). 


17 3 


Productos internos 34 y O, al multiplicar la columna por el renglón se obtiene 
3 3 1 
+01 10 2d 
21 35 dl 
Ax = (0, O, 0), de modo que x = (2, 1, 1) es una solución; las otras soluciones son 


cx =.(020.0 C) 


10.0 1.3 4 13 4 
Ejemplos: Diagonal JO 2 0], simétrica |3 2 0), triangular ¡0 2 0], simé- 
IN DI 4 0 7 O 07 
03 4 
trica sesgada | -3 0 0]. 
=4: 000 
4;1 


a) 411 b) L;1 a au /ar E) la nueva a; eS aj T od 
11 


: a21 
b) segundo pivote a727 — —a12. 
11 


EÓ ÑK— A a ir 


430 


Soluciones a ejercicios seleccionados 


11. 


13. 


15. 
17. 


19. 


21. 


23. 


25. 


27. 


29 


31. 


33 


30 


ST. 


39. 


41. 


43. 


45. 


Nm 


porel eat pa 


Los coeficientes del renglón B son 2, 1, 4 provenientes de A. El primer renglón de AB 
es [6 31. 


al 7 E 1 O: _ MO dl | 
a= |; 02 =b ope = o pD=A,E=F=| e) 
AB: = B,A da b=c=0.AB, = BA da a =d. Así A = al. 


ACA + B)+ B(A+B)(A+BNXB +A), A?+AB + BA + B? siempre es igual a 
(A + BY. 


a blip q| _lal[p al E bltr s] _ jap+br aq +bs 
0% 7 0 E d cpedr 9-3. ds 1 
E e: 0 7 E ES : 

A” =A;,B" = B il C E o matriz cero. 


EnmEnb = (1, —5, —-35) pero E21Ez2b = (1, —5, 0). Así, el renglón 3 no siente 
ningún efecto debido al renglón 1. 

Al cambiar az3 de 7 a 11 se cambia el tercer pivote de 5 a 9. Al cambiar az3 de 7 a 2 
se cambia el pivote de 5 a ningún pivote. 

Para invertir Ez,, se suma 7 veces el renglón 1 al renglón 3. 


050 
La matriz es R3, = 0 0 


«Ue el 
1 O O ESA Es | DL 
Ei =j0 1 Ol;/0 1 0l;£3¡£i3=|¡0 1 Ol. ¡Pruebe con la matriz identidad! 
0-05 Ol 1-04 
E>,¡ tiene La = 2, Ex tiene Lx => —8, Ea tiene la = =3. En caso contrario, las 
Es coinciden con /. 
ar b+ c= 4 a=2 
a +2b+4c = 8 proporciona b= 1. 
a + 3b +09c = 14 c=1 


a) Cada columna es £ multiplicado por una columna de B. 
1.0 3 a IPA 
E EB=|| Í H 2 == 1 4 a 
Los renglones de EB son combinaciones de los renglones de B, por lo que son múl- 
tiplos de [1 2 4]. 
(renglón 3) -xes  a3¡Xx;, y (A) 11 = (renglón 1) - (columna 1) = Y 01j0j1. 


BA = 3l es de 5 por 5, AB = S] es de 3 por 3, ABD = 5D es de 3 por 1, ABD: No, 
A(B + C): No 

ads El 
as B=4TI. bB=0 co) B=]j0 1 Ol. 

E 50.0 


d) Todo renglón de Bes 1, 0, O. 
a) mn (todo) b) mnp. c) n? (esto es n? productos punto) 


1 0 cs 0.0.0 7 30 
21 [33 0]+|4/[1 2 1] =/6 6 O] +4 8 4| =]|10 14 al. 
1 


2 1 6.6 0 E: E: 











47. 


49. 


Si. 


53. 


S3. 


55 


59. 


61. 
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EEE 
por B es REG o ; : 
Los bloques (2, 2) $ = D — CAT'B constituyen el complemento de Schur: los blo- 


ques en d — (cbía). 
A multiplicada por X = [x, xz x3] es la matriz identidad /[ = (Ax, Ax, Axx]. 


O coincide con ao ana cuando b = =d 
c+d c+d ao bea iS 
2x +3iy+z+5t = 8es Ax= bcon la matriz A = [2 3 1 5] de 1 por 4. Las so- 


luciones x llenan un “plano” tridimensional en cuatro dimensiones. 
ES 
El producto punto [1 4 5] | y] = (1 por 313 por 1) es cero para puntos (x, y, z) so- 
Z 
bre un plano x + 4y + 5z = O en tres dimensiones. Las columnas de A son vectores 
unidimensionales. 
Axwv=[3 4 5l' y viev =50; vx*x A proporcionan un mensaje de error. 


8 3 4 3 +u S-u>+rv 5-—u 
M=11 5 91 =15-u—vuv 5 S+uw+vl; 
O AS 5+vu 5+u—u 8 


M311,1,D = (5,15, 15); Ma(1, 1,1,1) = (34, 34, 34, 34) porque la suma de los 
números 1 a 16 es 136, que es 4(34). 


Conjunto de problemas 1.5, página 39 


1. 


3. 


11. 


U es no singular cuando ningún elemento sobre la diagonal principal es cero. 


E OOO OOO OO 20050 
2 1. 0li-2 1 Ol=jo0 1 Ol:i-2 1 Ol| 2 1 0|=7 también. 
=1 -1 1-1 1 11 jo O 1 |-1 1 1i-1 -—1 1 


ETFIGINGEE =E TU FUFE=E"VE=l1; también (GFEXE TF IGN =1 


roo ias Sl pasen 123 e 2 
«LU=8¿6¡0 1 0 O 5 d H eliminación, 050 Wi v E fa 
LO A | 0 O —1 Oe 005] yy) Al 


1000 1.0500 
AO 0D A0550 
O A A o o 
002 a | 


. a) No singular cuando d,d,d3 % O. b) Suponga que d; % 0. Le = b se resuelve yendo 


0 d; —d; 0 174 0 
hacia abajo: Lc = b proporciona c = jO|. Así, [0 d¿ —d¿| |v| = |O 


1 0 0 da w 1 
1/ dz 
proporciona x = |1/d3|. 


1/ da 


2 
Al resolver Lc = b yendo hacia abajo se obtiene c = a : Al resolver Ux = c yendo 
0 


3 
hacia arriba se obtiene x = a a 
0 
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Permutación 1 0.0 a 2 
AS renglones 2y3 [9 Ú 1, [uf = [31 
O 1 0| Juw 4 
Permutación O a l 
renglones 1 y 2 A 0 Ml E 
00 TU 1 
OTE OS de A O OA OS 
15. PA=LDUes|i 0 0/1 O 1| =]j0 1 0O¡]0O 1 0107 chas 
O Zo cd 2 Mr Oo O TAO 0707 
O E E O SIS 6 5d dE Or Dd pd 2 
PA LD ES 0 00 da IL A ld add AO. == 001-164 00 
OL Dirt e dl Ze OS SO O “OY 107 00 
7 € 
17. Lseconvierteen|1 1 0¡. MATLAS y otros códigos utilizan P4 = LU. 
z 0.41 
19. a = 4 conduce a un intercambio de renglones; 3b + 10a = 40 conduce a una matriz 
singular; c = O conduce a un intercambio de renglones; c = 3 conduce a una ma- 


triz singular. 


21. £3, = 1 y lo = 2 (£3 = 1): invierta los pasos para recuperar x + 3y + 6z = lla 
partir de Ux = c; 1 multiplicado por (x + y + z = 5) + 2 multiplicado por (y + 2z = 
2) + 1 multiplicado por (z = 2) proporciona x + 3y + 6z = 11. 


1 1 A ES! 
2310. 1 =2 1 A=|0 2 3|=U. 
0-2 1 DO 0 0-6 

100 
A=|2 1 0|U=E3 Ey U=LU. 
o 
25. De 2 por 2: d = 0 no está permitido. 


pd A $ 1 de E d =1, e = 1,entonces £ = 1 
E O E SE | f h f =0 no está permitido 
| Al 


m i sin pivote en el renglón 2. 


2 4 8 Z 
27. A= : 3 | tiene L =1 y D= | 3 amo ño Uma (pivotes 
y 


007 

1.24 
en la diagonab; A = LDUtieneU=D""A=j|0 1 3| con unos en la diagonal. 

AE 1 | 
a Aa a a 1 a a a a a Á0 
as EDO SD> Dd A ba Doa. Da : Aa 
ds e IS BE e MA e OS UN c=b A 
as Dio Co ad : E: A SE | dE dÁAc 





31. 


33. 


do 


aye 


39. 


41. 


43 


+ 


45, 


47. 
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1 O E a a 0 a 
| 1 1 =£7U0; la awb b = (misma L,) b 
0 ba 1 0 b b+ce c 


(misma U) 


1 00 4 41 11 1 1 4 3 

1 1 O|c=|Si|proporcionac=|1|.¡0 1 1|x=|1| proporciona x =|0|. 

E 5 0 0.0 1 - li . 
U. 


La submatriz superior de 2 por 2 contiene los dos primeros pivotes 2 y 7; Razón: La 
eliminación sobre A comienza en la esquina superior izquierda con eliminación sobre B. 


+ 1 1 1 
Ea O 
LoS 6% DO ES 
1 4 10 20 35 
L 37 10 39 70 
1 y LD RS | El triángulo de Pascal en L y U. El có- 
| ¡o ES digo lu de MATLAB arruina el patrón, 
=11 2 1 1 3 6l|. El código chol no realiza ningún inter- 
A | Lcd cambio de renglones para matrices si- 
¡e E | 1| métricas con pivotes positivos. 


Cada nuevo miembro derecho sólo cuesta n? pasos en comparación con los n*/3 para 
eliminación total AÑH. 


2 intercambios; 3 intercambios; 50 intercambios y luego 51. 


0 1 0 E 450 OSO a 
P=|0 0 11;,=j0 O 1j y P=]|0 1 0 

1500 O" 1050 Il” 00 
(2, proporciona un intercambio de columnas). 


Hay n! matrices permutación de orden n. Al final, dos potencias de P deben ser las 
mismas: S1 P” = P*, entonces P'"* = [, Ciertamente, r — s<nm! 


P o 1 UT 
Pos es 3 por 3 con P, = ,P¿= 0 0 1, y Pé=J. 
P; 1 0 
20,0 
La solución es x = (1,1,...,1).Así x = Px. 


Conjunto de problemas 1.6, página 52 


1. 


o: 


l 


AR 


A 7 
P dE = (3 —senó cosó 


APE=BCOISAS*=UTLP 


Ni O 


l AE | cos 0 po 


5. A(AB) = (quitar paréntesis) = (A2(B) = 1. 


A a 
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7. ee | Ser 1/ 2 


9. 


11. 


d9: 


AS, 


17. 


19. 


21. 


23, 


25. 


27. 


29. 


31. 


o 1 3 y E 
17 =/3/9 1/10 2312 , f o todas tienen A 7 


Si el renglón 3 de A”? fuese (a, b, c, d), entonces con AA = / se obtendría 2a = 0, 
a + 3b = 0, 4a + 8b = 1. Esto no tiene solución. 


E: 


EU E e OO (E ES E PES Sl 
c) P ¡e ba ¡+ a Ly = B(A + BULA. 


O a CS O O A 

ATB=8;BA=38;AB' = b 2 BA = b y] 

a) nía + D/ 2 elementos sobre y arriba de la diagonal. b) (n — D)n/ 2 elementos 
arriba de la diagonal. 

a) La inversa de una matriz triangular inferior (superior) sigue siendo triangular infe- 
rior (superior). Al multiplicar matrices triangulares inferiores (superiores) se obtie- 
ne una matriz triangular inferior (superior). b) Las diagonales principales de Ly* 
L¿D. y D¡U,Uz ' son las mismas que las de D, y D,, respectivamente. L7*L¿D, = 
D,U,Uz*, de modo que se tiene D, = D,. Al comparar los elementos fuera de 
las diagonales de L7'L¿D, = D,U,Uz*, ambas matrices deben ser diagonales. 
Li L,D, = D,, D¡U¡Uz* = D,, D, es invertible, de modo que L;*L, = 1, 
U,UZ* =1. Así, L, = L,, U, = Us. 


¡A pe Y EA Ds CES $ 0 A E E 
E UI DN E 10 OE E 1 0 AOS UI E 
o OO Zi O 07.1 


», Ñ ] E d - (2/0) o EN = LDL”. 


A partir de B(I] — AB) = (TI — BADEB se obtiene (1 — BAY? = B(1 — ABYy*B”7), 
una inversa explícita en el supuesto de que B e 7 — AB sean invertibles. Segundo mé- 
todo: si T — AB no es invertible, entonces BAx = x para alguna x diferente de cero. En 
consecuencia, AÁBAx = Ax, o bien, ABy = y, e l — AB podría no ser invertible. (Ob- 
serve que y = Ax es diferente de cero, con base en BAx = x.) 


e A EA 09 blo 02 SN 1 A 
E = Mel! B E | sei de modo que A * = 70 e q: 


a) En Ax = (1, O, 0), ecuación 1 + ecuación 2 — ecuación 3 es 0 = 1. b) Los 
miembros derechos deben satisfacer b, + ba = b3. c) El renglón 3 se convierte 
en un renglón de ceros; no hay tercer pivote. 

Si B intercambia los renglones 1 y 2 de A, entonces B”? intercambia las columnas 1 y 

2de A”!, 


Si A tiene una columna de ceros, también BA. Así, BA = Tes imposible. No existe A”?. 
1 1 1 1 
1 2 = |-1 1 = E, 
+ É 4-1 1 1 du L SI 
1 
entonces | 1 1 es L = E”!, después de invertir el orden de estas tres matrices 
A 


elementales y cambiar —1l a +1. 








3 


35. 


Eg 


39. 


41. 


43. 


45. 


47. 


49. 


SE 


5 


9. 


Sd 
359 


Ex 7358 
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A x ones(4,1) proporciona el vector cero, de modo que A no puede ser invertible. 


A OO 
=[ L —2 1 lo 1522 yu ad 


O E 
E 1 j-u a 


O —b 
L 6 
0 1 


4 ac=b 
1 EN 


oo 4) —i Y 
O 
pi 


GQ mk HN 


O» 
a O O m 
a OO 
O O 


OO 


0 
y 
1 


O O mn 


0 1 
0 A 2 0-1 1 10-12 12] _ E 
ó 24 ol > [ al o > lo a S =u A 


No es invertible para c = 7 (columnas iguales), c = 2 (renglones iguales), e = O (co- 
lumna cero). 


O 
ÓO == 0 O ma 


A“ = . La matriz AT! de 5 por 5 tiene 1s en la diagonal y arriba 


[e EN, o SE eso de 
OO 
O” 0 
pa me OS O 


de ésta. 


Tr 0 A“ 0 =D: 
EDF ICA DA I Ol 
Para Ax = b con A = ones(4, 4) = matriz singular y b = ones(4, 1), A1b, esco- 
ge x = (1, 0, 0, 0) y pinv(A) x b escoge la solución más corta x = (1, 1, 1, 1/4. 


oa O a ES 
A"=|, e yapa Y = (am = |, q E 


1 
entonces A“l!=-— b 
ce? |c 


E =(A5byY =(a45b7. 
((AB)")' =(BAATY =(A DD UBDA (UY es triangular inferior. 
a xTAy =a=5. bx A=[4 5 6l. c) Ay = El 


(POUPY) =x*PYPy = x*y ya que PYP = [; por lo general, Px- y =x + PTy A 


EIA EI0 


PAP* recupera la simetría. 
a) La traspuesta de RTAR es RTATRIT = RTAR =nporn. 


b) (RFR) y; = (columna j de R) - (columna j de R) = longitud al cuadrado de la colum- 
na j. 
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1 0 1 Lyac YBc T Yas 
61. Las corrientes totales son Ay = |-1 1  0l lycs| = |—ysc + yes |. 
O =1: LP Ya —yYcs — YBs 
De cualquier forma (Ax) Py = xY(ATy) = xB Yac FAB YBS —XcYBC HF XcYcs — As as — 


X3s YBS- 

63. Ax: yes el costo de las entradas, mientras x - AYy es el valor de las salidas. 

65. Estos son grupos: triangular inferior con diagonal de unos, diagonal invertible D y las 
permutaciones P. Dos más: permutaciones pares; todas las matrices no singulares. 


67. Al reordenar los renglones y/ o las columnas de E 2! se mueve el elemento a, con 





lo que no se obtiene E Al 


69. Casi seguramente, las matrices aleatorias son invertibles. 
71. La matriz —1, 2, —1 en la sección 1.7 tiene A = LDL? con €; ¡1 = 1 — >. 


Conjunto de problemas 1.7, página 63 


20 El 
1. ¡—] al 
a! 2 
—] 2 
1 2 l —3 
| 3 E 
=2 7 2 e = LDL" 
e —2 1 4 do 1 
3 3 1 3 5 4 det = 5 
7 7 l 
1 -—1 G 0 
—1 2 —] La suma de cada C 0 
3. Ap = —] 2 —1 renglón es 1, Ao |cl = jO)l. 
=l | por lo que Cc 0 
SL 1 C 0 


5. (u¡, us, 43) = (702/8, 0, —10?/8) en vez de los valores verdaderos (1, 0, —1). 
9 36 30 
T. HT? =|-36 192 -—180]. 
30 —180 180 


9. La matriz de Hilbert de 10 por 10 está muy mal condicionada. 


11. Un pivote grande se multiplica por menos que 1 en la eliminación de cada elemento 


abajo del pivote. Un caso extremo, con multiplicadores = 1 y pivotes = 3» 35 4, es 


EP DA | 
As Ai. 0. E 
e A 


Conjunto de problemas 2.1, página 73 


AS 


1. a) El conjunto de todas las (u, v), donde u y v son razones p/ q de enteros. b) El con- 
junto de todas las (1, v), donde u =Dov=0. 
3. C(4) es el eje x; N(A) es la recta que pasa por (1, 1); C(B) es R?; N(B) es la recta que 
pasa por (—2, 1, 0); C(C) es el punto (0, 0) en R?; el espacio nulo N(C) es R?. 








+ 
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. Reglas que no se cumplen: a) 7, 8,b) 1 c) 1, 2, 8. 

- b), d) y e) son subespacios. No es posible multiplicar por —1 en a) y c). No es posible 

sumar en f). 

. La suma de dos matrices no singulares puede ser singular (4 + (—A)). La suma de dos 

matrices singulares puede ser no singular. 

. a) Una posibilidad: las matrices cA forman un subespacio que no contiene a B. 

b) Sí; el subespacio debe contener a A — B= 1, 

c) El subespacio de matrices cuya diagonal principal es toda cero. 

Si f+ D60) es la f(g(x)) de costumbre, entonces (g + $)00) es g(F (0), que es dife- 

rente. En la regla 2 ambos miembros son f(g(A(0))). La regla 4 se rompe porque po- 

dría no existir función inversa f(x) tal que F(47 (0) = x. Si esta función inversa 

existe, se trata del vector —f. 

La suma de (4, 0, 0) y (0, 4, 0) no está sobre el plano; tiene x + y — 2z = 8. 

a) Los subespacios de R? son R? mismo, las rectas que pasan por (0, 0) y el punto 
(050) 

b) Los subespacios de R* son R* mismo, los planos tridimensionales n + v = O, los 
subespacios bidimensionales (n, - v=0 y n, : v= 0), las rectas unidimensionales 
que sólo pasan por (0, 0, 0, 0) y (0, 0, 0, 0). 

. El menor subespacio que contiene a P y Les P o RÍ. 

El espacio columna de A es el eje x = todos los vectores (x, O, 0). El espacio columna 

de B es el plano x-y = todos los vectores (x, y, 0). El espacio columna de C es la rec- 

ta de los vectores (x, 2x, 0). 

. Una combinación de las columnas de C también es una combinación de las columnas 

de A (mismo espacio columna; B tiene un espacio columna diferente). 

. La columna adicional b agranda el espacio columna, a menos que b ya esté en ese es- 

pacio: 

A E 0 1 (espacio de columna más grande) 

0 0011 (no hay solución para Ax = b). 


1 6 (b incluida en el espacio de columna) 
5 E | (Ax = b tiene solución). 


Espacio columna = RÍ. Todo b es una combinación de las columnas, ya que Ax = b 
es resoluble. 


ERAVESO ii E A LE ZO 
29. A=|1 O Olobienll O 11:;4=]12 4  0| (columnas en la línea 1). 
o .Q41.0 1 PU 070 


31. R? contiene vectores con dos componentes: no pertenecen a R?, 


Conjunto de problemas 2.2, página 85 


L x+y+z2=1,x+y+2=0.Al cambiar 1 a0, (x, y, z) =c(—1, 1, 0) + d(—1, 0, 1). 


3. Forma escalonada UY = 


0 : ] 
b ó 0 a , variables libres x,, x3, X4; Soluciones espe- 


ciales (1, 0, 0, 0), (0, O, 1, 0) y (0, —3, O, 1). Consistente cuando b, = 2b,. Solución 
completa (0, b,, 0, 0) más cualquier combinación de soluciones especiales. 


AA 


A A A A AAA A —Á 
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U —2Zy 3 2 —3 
SS. lul=- v =y Las Ol; ¡No hay solución! 
w 2 0 2 
7. ec = 7 permite u = 1, v = 1, w = 0. El espacio columna es un plano. 
As : pRÍA Reducida A y 
9.3 x=x O E xa. POL IR 10. 00 1 Ze 
0 2 |? cualesquiera renolónes o 0 
0 1 
a — 3b —2 Pa 
b) Solución completa x = 0 + x> 10 Xa 0 os cualesquiera 
b 0 AZ o 
0 0 


11. 


13, 


15, 
17, 


19: 


21. 


23. 
25. 


27. 


29. 


] p ] = 0! tiene espacio nulo = recta que pasa por (—1, 1), pero no tiene 
2 


.s » C » . » 
solución. Cualquier b = hi tiene muchas soluciones particulares de Ax, = b. 


¡cl A O A Lo =E 1 ll (a) r=1. 
R=|0 0 0 OZR=f0 0 o oprR=]0 070 Ol (DAS 
0.0500 000.0 A 25 1 E (5) 
Una matriz espacio nulo N = é es de n por n —r. 
Creo que es cierto. 
7 7 1 0 
Las soluciones especiales son las columnas de N = Ñ Y N=ji0 -—21l. 
0 1 
0 1 


Las r columnas pivote de A forman una submatriz de mm por r de rango r, de modo que 
la matriz A” tiene r renglones pivote independientes, con lo cual se obtiene una sub- 
matriz invertible de r por r de A. (Los renglones pivote de A” y A son los mismos, ya 
que la eliminación se efectúa en el mismo orden: simplemente para A” no vemos las 
columnas “libres” de ceros que aparecen para A.) 


(un wz) = u(uFw)z” tiene rango 1, a menos que vw = O. 


Se tiene que AB = /, cuyo rango es n. Luego, rango(AB) < rango(4) obliga a que ran- 
go(4A) = n. 


SiR = EA y la misma R = E*B, entonces B = (E*)*EA. (Para obtener B, A se redu- 
ce a R y luego se invierten los pasos de vuelta a B). B es una matriz invertible maulti- 
plicada por A, cuando comparten la misma R. 


Debido a que R empieza con r renglones independientes, R* empieza con r columnas 


independientes (y por tanto ceros). Así, su forma escalonada reducida es e o] , don- 
de / es de r por r. 
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PAZ 
31. Sic=1,R=j0 O O O] tiene x>, x3, xa libres. 
0000 
¡END ASE 
Sic*1,R=j0 1 O 0j tiene x3, xa libres. 
O E0.70:0 
e E a 
: E 00 O _ PO 00 E DOS. 
Soluciones especiales en N = 0 : 0 (c=by N= 1 0 (lc 1) 
07. 0% 3 QA 


33. 


30: 


37. 
39. 


41. 


43. 


45. 


47. 


AE O os DS 0 E 
Sic=1,R=| p| tiene x; libres; si e =2, R =| 0 
sicAxA1,2. 


Soluciones especiales en N 


| tiene x2 libres; R = I 


o! (c = 1) obien, N = H (lc = 2) obien, N = 


matriz vacía de 2 por 0. 


12 +0 0 
iS ? E ' 0 
Xcompleta Ad io 1 » Xcompleta 1/2 + X2 0 + X4 LA 
0 0 
PS TT ae e OD 203 , 
a) Resoluble si ba = 2b, y 3b, — 3b3 + b¿=0.Así, x = 0D (no hay varia- 
1 
bles libres). b) Resoluble si b2¿ = 2b, y 3b, — 3b3 + b4 =0. 
Sb, — 2b3 =] 
Asíx = | b3-2b, | +x3 711. 
0 1 


Un sistema de 1 por 3 tiene por lo menos dos variables libres. 
a) La solución particular x, siempre se multiplica por 1. b) Cualquier solución puede 


SR O ll a Z 
Ser Xp» C) p 4 5 = | S Así, | i es más corta (longitud /2) que o: d) La 
solución “homogénea” en el espacio nulo es x, = O cuando A es invertible. 
e 


e id 
xy se multiplica por 2, misma x,;; | z 4 es | 0 


d, las soluciones especiales también in- 
El . a ; : 
cluyen a las columnas de 1% y las soluciones especiales no cambian. 


Para A, q = 3 proporciona rango 1, y cualquier otra qg proporciona rango 2. Para B, 
q = 6 proporciona rango 1, y cualquier otra q proporciona rango 2. 


a) r<m,siemprer<n.b)r=m,r<n.c)jr<em rr =n.d)r=m=mn. 
l: 0050: 0 0 ESO:sds 1 

==> E00 DE O Y A OO 2 |: no hay solución debido al 
0.0050 0 Qi07U 5 

renglón 3. 


o GEA ná ds ari 
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49, 


SL. 


33. 


do. 


ad 


>>. 


6l. 


63. 


63, 


67. 


69. 


e: 
A= 0 -21;B no puede existir porque dos ecuaciones en tres incógnitas no pueden 
0003 


tener una solución. 


El rango de A es 4 — 1 = 3; la solución completa de Ax = 0 es x = (2, 3, 1, 0). 


1 0 22054 
R=|0 1 —-3 0O| con —2, —3 en la columna libre. 
O 0 O 1 


a) Falso. b) Verdadero. c) Verdadero (sólo n columnas). d) Verdadero (sólo m 
renglones). 


A E EE ES HRS PUE Dto O ol 

ee 000 ATA R=|900 10 1 1| (Rnoproviene 
o: 0 ES 0600005 1 deestaU) 
00-000 000 0 BO" 05000 

Si columna 1 = columna $, entonces xs es una variable libre. Su solución especial es 


EDO 20.1): 


Es seguro que la columna 3 no tiene pivote, ya que es una combinación de columnas 
anteriores y xs es libre. Con cuatro pivotes en las otras columnas, la solución especial 
es (1, 0, 1, O, 1). El espacio nulo contiene a todos los múltiplos de (1, 0, 1, 0, 1) (una 
recta en R”). 


1. 00,005 :=4 
A 01 O 31. 
A A 


Esta construcción es imposible; dos columnas pivote, dos variables libres, sólo tres co- 
lumnas. 


005 
A= A 


Lo más probable es que R sea f; lo más probable es que R sea Í con el cuarto renglón 
de ceros. 


Cualquier renglón cero aparece después de estos renglones: R = [1 —2 -—3], 
e lo O E 
R = F 1 ol R=I 


Conjunto de problemas 2.3, página 98 


1. 


1 1 1 e: 
O 1 1]j[|c2¡=0 proporciona (3 = c2 = Cc, = 0. Pero v; + va — 4uz + v¿= 0 
O 0 1 C3 


(dependiente). 


Si a = 0, entonces columna 1 = 0; si d = O, entonces b(columna 1) — alcolumna 2) 


= 0; sif = 0, entonces todas las columnas terminan en cero (todas son perpendicula- 3 ES 


res a (0, O, 1), y todas en el plano xy, deben ser dependientes). 








11. 
13. 
15. 


TA 


19. 


21. 


23, 


25, 


29. 
31, 


33: 


E 
dE Si E pa HINDI 


á Led A O CR é "Salicionés 3 ejerce derma y 441 
"a E e 0 “¿LACIONAL 
: E O a 
1.2 3] fe. EnevAs 237 E 1 121 123803 
a) 13 1 2|>|[0 —seaigdimos al nacion DEL URUGUAY 
E | Qs «== A 
1 2 ? E 
invertible => columnas independientes 
Est el (hubieran podido usarse renglones) 
0 0 -18/5 P Ln 
1 DS DES 1 0 la suma de las columnas 
DIS 1 21 >|/0 7 —71,A|1]| = ¡O], es0 (hubieran podido 
AS 1 0750 0 1 0 usarse renglones). 


La suma y, — vz + va = O porque (w2 — w3) — (w, — 03) + (w; — wa) = 

a) Los cuatro vectores son las columnas de una matriz A de 3 por 4 con por lo menos 
una variable libre, de modo que Ax = 0. b) Dependientes sí el rango de [v, vz] es 
00 1.c) Ou, +c(0, 0, 0) = 0 tiene una solución distinta de cero (tome cualquier 
c% 0). 


a) Recta en R?. b) Plano en R?. c) Plano en R3. d) Todo R*. 

Todas las dimensiones son 2. Los espacios renglón de A y U son los mismos. 

v= Hu +0) + hu —w) y w= (uv +w) — L(u —w). Los dos pares generan 
el mismo espacio. Son una base cuando v y w son independientes. 


Si la eliminación produce uno o más renglones cero, entonces los renglones de A son 
linealmente dependientes; 


l: 1:00 1 1.000 

por ejemplo, en el problema 16 . , : : os , a : , 
UE e e A | 

1 1.0.0 

E A 

00 OL 

0" 20:00 


Los n vectores independientes generan un espacio de dimensión n. Forman una base 

para ese espacio. Si son las columnas de A, entonces m no es menor que n (m > n). 

C(U): Bases cualesquiera de R?; N(U): (renglón 1 y renglón 2) o bien, (renglón 1 y 

renglón 1 + renglón 2). 

Columnas independientes => rango n. Las columnas generan R” => rango m. Las co- 

lumnas son una base para R” > rango = m = n. 

a) La única solución es x = O porque las columnas son independientes. b) Ax = bes 
resoluble porque las columnas generan RO. 


. Las columnas 1 y 2 son bases para los espacios columna (diferentes) de A y U; los ren- 


glones 1 y 2 son bases para los espacios renglón (iguales); (1, —1, 1) es una base pa- 

ra los espacios nulos (iguales). 

rango(4) = 2 sic =0 y d = 2; rango (B) = 2, excepto cuando c = doc = —d. 

Sean v; = (1,0,0,0),...,v4 = (0, O, O, 1) los vectores de coordenadas. Si W es la 

recta que pasa por (1, 2, 3, 4), ninguno de los vs está en W 

a) Si no hubiera una base, sería posible sumar más vectores independientes, con lo 
cual se excedería la dimensión k. b) Si no hubiera una base, sería posible elimi- 
nar algunos vectores, dejando menos que la dimensión k. 


A Ur e e 


RA A A A A A A A e 
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33. 


3% 


39. 
41. 


43. 


45. 


a) Falso, podría no haber solución. b) verdadero, 7 vectores en R? son dependientes. 

LL 0050 0.0.0 0.00 O 150 0 O 1 
2010 210. 010 5104 764-0770 20%: 207 Summer 500 08 0 070 

0-00 00-0500 0501 0.00 1050 
0.00 ON E TO 0.0 1 0 0 0 

b 

E SAS E Y A 
0 1 0 0.000 LO 00 +1 50 
A =-—A?. 
y(0) = O requiere A + B + C =0. Una base es cos x — cos 2x y cos x — cos 3x. 
y 100), y2(0), y3(x) pueden ser x, 2x, 3x (dim 1) o bien, x, 2x, 1% (dim 2), o bien, x, 4,17 
(dim 3). 
1 1 1 1 1 

1 = |1 == Elk 1 + 1 

1 E 1 1 1 
1 
ri 
1 


Compruebe el elemento (1, 1), luego (2, 3), luego (3, 3), luego (1, 2) para demostrar 
que estos cinco Ps son independientes. Cuatro condiciones sobre los nueve elementos 
hacen que las sumas de renglones y columnas sean iguales: suma del renglón 1 = su- 
ma del renglón 2 = suma del renglón 3 = suma de la columna 1 = suma de la colum- 
na 2 (= suma de la columna 3 es automático porque suma de todos los renglones = 
suma de todas las columnas). 

Si la matriz [A b] de 5 por 3 es invertible, b no es una combinación de las columnas 
de A. Si [A b] es singular y las columnas de A son independientes, b es una combina- 
ción de estas columnas. 


Conjunto de problemas 2.4, página 110 


de 


3. 


11. 


ES 
iS. 


Falso; lo único que se sabe es que las dimensiones son iguales. El espacio nulo izquier- 
do tiene una dimensión más pequeña dim = m — r. 


CA): =2,(1,0, 1560, 1,0) NWMin=7.=2,0,-=1,1,0).(21.0,0, 1D; 
C(ABD:r =2,(1,2,0,1),(0,1,1,0); N(4AD:m=r =1,(-1,0, 1); 

C(U): (1,0,0), (0, 1,0); N(U): (2, —1,1,0),(—1,0,0, 0); 

COSG2 0 DO LLO) Na (00.1% 


. Á multiplicada por cada columna de B es cero, de modo que C(B) está contenido en el 


espacio nulo N(4). 


. Con base en Ax = O, el espacio renglón y el espacio nulo deben ser ortogonales. Con- 


sulte el capítulo 3. 


12 4 
[1 2 41,|2 4  8| tiene el mismo espacio nulo. 
E > A 


Si Ax = O tiene una solución diferente de cero, entonces r < n y C(A*) es menor que 
R”. Así, AYy = Fno es resoluble para alguna f. Ejemplo: A = [1 1] yf= (1, 2). 

d = bela; el único pivote es a. 

Con columnas independientes: rango n; espacio nulo = (0); el espacio renglón es R”; 
inversa izquierda. 

A=[1l 1 0B=[0 O 1] 


E 








19. 


21. 


23. 


25. 


27. 


29. 


31. 


33. 


33: 


37. 


39. 


41. 
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No: por ejemplo, todas las matrices invertibles de n por n tienen los mismos cuatro 
subespacios. 


1 0 
a) |1 Oj. b) Imposible: dimensiones 1 +13 c) [1 1]. 
O 1 


d) ES el e) Imposible: espacio renglón = espacio columna requiere m = n, 


Así,m>—r=n-—r. 

A invertible: base del espacio renglón = base del espacio columna = (1, 0, 0), (0, 1, 0), 

(0, O, 1); las bases del espacio nulo y del espacio nulo izquierdo son vacías. B: base 

del espacio renglón (1, O, 0, 1, 0, 0), (0, 1, 0, O, 1, 0) y (0, 0, 1, 0, O, 1); base del espa- 

cio columna (1, O, 0), (0, 1, 0), (0, O, 1); base del espacio nulo (—1, 0, 0, 1, 0, 0), (0, 

—1, 0, 0, 1, 0) y (0, O, —1,0, O, 1); la base del espacio nulo izquierdo es vacía. 

a) El espacio renglón es igual al espacio nulo. En consecuencia, el rango (dimensión 
del espacio renglón) es el mismo. b) El espacio columna es igual al espacio nulo 
izquierdo. Mismo rango (dimensión del espacio columna). 

a) La inexistencia de una solución significa que r < m. Siempre se tiene r < n. No es 
posible comparar m y n. 

b) Sim — r > 0, el espacio nulo de A* contiene un vector diferente de cero. 

Base del espacio renglón (1, 2, 3, 4), (0, 1, 2, 3), (0, 0, 1, 2); base del espacio nulo 

(0, 1, —2, 1); base del espacio columna (1, O, 0), (0, 1, 0), (0, O, 1); el espacio nulo iz- 

quierdo tiene una base vacía. 

Si Av = 0 y ves un renglón de A, entonces v » v = 0. Sólo v = 0 en ambos espacios. 

Renglón 3 — 2(renglón 2) + renglón 1 = renglón cero, de modo que los vectores c(1, 

—2, 1) están en el espacio nulo izquierdo. Ocurre que los mismos vectores están en el 

espacio nulo. 

a) u y w generan a C(A4). b) vu y z generan a CAB. c) Rango < 2 si u y w son depen- 
dientes o v y z son dependientes. d) El rango de uv? + wz" es 2. 

a) Verdadero (mismo rango). b) Falso (4 = [1 0]. c) Falso (A puede ser inver- 
tible y también no simétrica). d) Verdadero. 

au = 1,42 0,413 = 1,49 = 0,4 = 1,43 =0,43 = 1,433 = 0,49 =1 

(no es única). 

Rango r = n significa espacio nulo = vector cero y Xx, = 0. 


Conjunto de problemas 2.5, página 122 


3. 


E 1 0 1 
A == 10 1  —1 |; N(4) contiene múltiplos de | 1]; N(4*) contiene múltiplos de 
1 O == 1 
1 
¡E 
=1 


La suma de los elementos en cada renglón es cero. Por tanto, cualquier combina- 
ción posee esa misma propiedad: A + f.+f=0;ATy =f => + y => f, 
=A+Y=S fray =fA>f+A+4 =0. Significa que la corriente to- 
tal que entra desde el exterior es cero. 


e rl e TE 


a. PA 


A A A A A A AAA —Á 
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CTE E EC 
e A : ? Cr Es 63 , : 
5. cy Cr Ca =c>r |; E No tiene pivotes €, + C3, 
e 2 
50 —C2 Ca + C3 : . SÍ 


C1C3 TF C¡Ca E C2C3 
C; ds C3 : 


7. Las condiciones sobre bson bi + ba — bs = 0, b3 — ba + bg =0, ba — bs + b¿ =0. 


3 —1 —-1 -—1 Ci +> 3 E Cs EA +0) ”>6S 
9 Y Ss =5L 1 “Ej cí + C3 + Ca 03 64 
“1 —1 E ==) 03 C2 + C3 +C6 “Cb 
do 3 Us =E4 =E6 Ca Cs +C6 
Estas cs que se unen con el nodo j ahora aparecen en el renglón j. 
1 0 0 O: 1 Ol fy 0 
0 2.0 0 = 0 1 0 -4 de 
0. 0 53 0 0 1. 0]] 0 3 4 
11. 0 0 0 1 0 oO —1 Ya =|0];x = O e de 
o 0 0 0 0 Odo Ff 3 En 
li CO LE 0 70 0 AOS f 0 5 
'Ñ 0 1 0. ll 0 0 0 X3| 14] 
13, Hay 20 elecciones de 3 aristas de 6, ya que “6 en 3” = En = 20. Cuatro elecciones 


proporcionan triángulos, dejando 16 árboles generadores. 
15. Creo que ya está considerada. 
17, 9 nodos — 12 aristas + 4 ciclos = 1; 7 nodos — 12 aristas + 6 ciclos = 1. 
19. Con x = (1, 1, 1, 1) se obtiene Ax = 0; así, ATAx = 0; de nuevo, el rango es n — 1. 


O 10 de 1 
¿6 A ES 
21. = 
e A a E 
O 
O (Mi = 4017 + *** A Ginln) 
a NS AS O y se obtiene 4;, ay; = 1 cuando hay una ruta 
E de 2 pasos que va de ¡ak a j. Observe las 
OS E SS tres rutas que van de un nodo a sí mismo. 


Conjunto de problemas 2.6, página 133 
0 (a A E 
1. Rotación E e E 4 
3. [4x1 = 1 siempre produce una elipse. 


5. Son transformados a (1, 3), (2, 6), (— 1, —3). El eje x gira; las rectas verticales se des- 
plazan hacia arriba o hacia abajo, pero permanecen verticales. 


Matriz de 0 E : : 

7. segundas . El espacio nulo es generado por (1, 0, O, 0) y (0, 1, 0, 0), 
¿ 0.0.9.0 
derivadas 000 


que proporcionan una FP, lineal. Las segundas derivadas de funciones lineales son ce- 





11. 


13. 


15. 


a 


15. 


21. 


23, 
23. 
27. 
29. 
aL 


33. 


le 


39. 


41. 


43. 


43. 


. M1) =0pero M = | 
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ro. Accidentalmente, el espacio columna es el mismo que el espacio nulo, porque las 
segundas derivadas de cúbicas son lineales. 


. €” y e * son una base para las soluciones de u” = u. 


cosó —sen9| [coso —seng| _ |1 0 H?=] 
senó  cosf0l ¡send cos 8 Ol E 


a) Sí. b) Sí. ¡Para (AB)C o A(8C) no se requieren paréntesis! 


1.0 0 O]  ya?=7, la doble traspuesta de una matriz 
Aa 0.001 0 proporciona la matriz misma. 
Ot 0-0 Observe que 43 = 1 porque la traspuesta 
O 009 de la matriz 2 es la matriz 3. 
090 mao  [0s9 noo 
A = B=|0 O 1 O[¡AB= BASI 1 “00: 
Pao 0.001 o Doa 
0-05 A 000 20 1 
a) es invertible con 7” *(y) = y*%; c) es invertible con T7U(y) = y — 11. 


Con w = 0, la linealidad proporciona T(v + 0) = T(v) + T(0). Así, T(0) = 0. Con 
c = —1, la linealidad proporciona 7(—0) = —T(0). Con certeza T(—0) = T(0). Así, 
T(0) = 0. 

STO) = Su) = y. 

b) y c) son lineales, a) falla T(2v) = 27(v), d) falla Tlv + w) = Tv) + T(w). 
T(T(0y) = (v3,01,02); Tv) = 0, Tv) = TT (W)) = Tv). 

a) T(1, 0) = 0. b) (0, O, 1) no está en el rango. c) T(0, 1) = 0. 

La ley asociativa proporciona A(M, + M,) = AM, + AM,). La ley distributiva aplica- 
da a las cs proporciona A(cM) = c(AM. 

Con ninguna matriz se obtiene A hi 5 = b o Para los profesores: la dimen- 
sión del espacio de matrices es 4. Las transformaciones lineales en ese espacio deben 
provenir de matrices de 4 por 4 (16 parámetros). Las multiplicaciones por A en los pro- 
blemas 31 y 32 son transformaciones especiales con sólo 4 parámetros. 


O db 


0 en el núcleo. 
070 


| = T(M); éstas llenan el rango. M = bi E 


-1 
9 m= | ' y) N= |? 4 5 0 14d: =bE. 


Reordenar la base con la matriz permutación; cambiar las longitudes por medio de la 
matriz diagonal positiva. 


a tas A 4. 
1 pb B| 1Bl=|Sl; el determinante de VanderMonde = (b — aXc — a) 
IA 
(c — b); los puntos a, b y c deben ser distintos, y así el determinante + O (es posible 
interpolar). 

Si T no es invertible, entonces T(v,),..., T(v,) no es una base. Así, no es posible 
escoger w; = T(v,) como base de salida, 

ST) = Ll, 2), pero S(w) = (—2, D) y T(Sív) = (1, —2). Así, TS H ST. 
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47. La matriz H de Hadamard tiene columnas ortogonales de longitud 2. Por tanto, la in- 


49. 


versa de Hes H"/4 = H/4. 
Falso: los n vectores diferentes de cero deben ser independientes. 


ia de problemas 3.1, paa 148 


3. 
s 
ye 
Td 
11. 
13. 


15. 
17. 
19. 


21. 


23, 


25 


» 


27. 


29. 


31. 


257 
30: 


- lx =V21; ly =342; x Py = | 
(u/x0/y) = —1 significa que x1 y, + x2y2 = O, de modo que x*y = 0. 

Y, y v3 son ortogonales, así como uz y uz. 

x =(-2,1,0); y = (—1, —1, 1); el renglón z = (1, 2, 1) es ortogonal al espacio nulo. 
El complemento ortogonal es la recta que pasa por (— 1, —1, 1) y (0, O, 0). 

Si ATy = 0, entonces yTb = yTAx = (y "A)x =0, lo cual contradice que y*b % O. 


La figura separa cualquier y en R” en la parte del espacio columna + la parte del es- 
pacio nulo izquierdo. 


No puede existir una matriz así, ya que (1,2, D'(1,-2,1) %0. 
La matriz con la base para V como sus renglones. Así, el espacio nulo es V* = W. 
a) Si V y W son rectas en R3, V* y W- son planos que se cortan. b) V. 


(1,2, —1) es perpendicular aP. A = p 4 tiene N(A) =P;¡B =[1 2 —1] 
tiene espacio renglón = P. 


A = E , tiene subespacios = cuatro rectas; (1, 1) ortogonal a (— 1, 1), (1, 2) or- 


togonal a (—2, 1). El espacio renglón siempre es perpendicular al espacio nulo 1. 


1 2 —3 2 1 1 1 
a) 29 11. b) ¡—3| noesortogonal a |1|. c) l1¡enC(4) y lO 
—3 $ ==2 e ] j 0 


le el 
 : 
e) (1, 1, 1) está en el espacio nulo y en el espacio renglón; no existe una matriz así. 


en N(A*) es imposible: no son perpendiculares. d) A = | tiene A? =0, 


a) Si Ax = b tiene una solución y ATy = O, entonces ¿Ty =(Ax)y =0. b) bno 
está en el espacio columna, así, no es perpendicular a ninguna y en el espacio nulo 
izquierdo. 

x =x, + x,, donde x, está en el espacio renglón y x, está en el espacio nulo. Así, 

AX, =0y Ax = Ax, + Axa = Ax,. Todos los vectores Ax son combinaciones de 

las columnas de A. Six = (1, 0), entonces x, = (1 Es 2 ib 2). 

a) Para una matriz simétrica, el espacio columna y el espacio renglón son iguales. 

b) x está en el espacio nulo y z está en el espacio columna = espacio renglón; por tan- 
to, estos “vectores característicos” tienen Ez = 0. 


x se separa €n x, + xp = (1, 1) + (1,1) = (2,0). 


pS ”. o. > XxX ye > a 
Áx = Bx significa que[ A B] Be = (. Tres ecuaciones homogéneas en cuatro 


incógnitas siempre tienen una solución diferente de cero. Aquí x= (3, 1) yX = (1,0), 
y Ax = BZ = (5, 6, 5) están en ambos espacios columna. ¡Dos planos en R” (que 
pasan por cero) deben cortarse por lo menos en una recta! 
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37. Ay = O proporciona (Ax) y =xTATy =0. Así, y LAx y N(AT) 1 C(A). 


39. 


41. 
43. 
45. 


47. 


49. 


51. 


Si es el espacio nulo de A = E a A En consecuencia, S” es un subespacio in- 
cluso si $ no lo es. 


Si V es todo R*, entonces V” sólo contiene al vector cero. Así, (V+)+ =R* = V, 
(1, 1, 1, 1) es una base de P”. El espacio nulo de A = [1 1 1 1] es el plano P. 


La columna 1 de A”? es ortogonal al espacio generado por los renglones 20.,..., 
n-ésimo de 4. 


2 a 
A = |-1 2 2 
aL Z 


ATA = 9] es diagonal: ATA), = (columna i de 4) * (columna 7). 

a) (1, —1, 0) está en ambos planos. Los vectores normales son perpendiculares, ¡y los 
planos siguen cortándose! b) Se requieren tres vectores ortogonales para generar 
todo el complemento ortogonal en R%.. c) Las rectas pueden cortarse sin ser orto- 
gonales. 

Cuando AB = O, el espacio columna de B está contenido en el espacio nulo de A. En 

consecuencia, dimensión de C(B) < dimensión de V(4). Esto quiere decir rango 

(B) < 4 — rango(A). 


Conjunto de problemas 3.2, página 157 


1. a) (x + y)/2 > ./xy Gmedia aritmética > media geométrica de x y y). 
d) llx+y11? < Cll + ly 1D? significa que (x +9 (x + y) < lx 11? +21 11119 + ly 11? 
El miembro izquierdo es xYx + 2x*y + y" y. Después de cancelar lo anterior, se 
obtiene x*y < [|x]lllyI1. 
3. p =(10/3, 10/3, 10/3); (5/9, 10/9, 10/9). 
1 
5. cos9 = 1/./n, de modo que 9 = arccos(1/./n); P = |: | [1/n +++ 1/n]1 = 
1 
todos los elementos ha k 
n 
7. Se escoge b = (1,..., 1); la igualdad ocurre si a; = * +» = a, (entonces a es parale- 
la a b). 
nar Das om y 
9, pp 240” _ ala*t aja A 
ataata  (aTaKata) alía 
a SL e 1.0 
E ECO > A 5% 10 10 E ; 
188 or= Sho: n= [3 " b) P,+ Pa = |) 1, 
10 10 10 10 
0 0 
P¡P, = o ol La suma de las proyecciones sobre dos rectas perpendiculares 
proporciona el vector mismo. La proyección sobre una recta y luego una recta per- 
pendicular proporcionan el vector cero. 
T 
13. Daza e a eo ada ES = ] 


aTa aTa ata 
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15. 4x1? = (Ay (AD) = x4%4x, 14d? = AN Año =xAA Tx. Si ATA = AA, en- 
tonces Jl4x]| = NAF xl]. (Estas matrices se denominan normales). 

17. a) aTbjaTa = 5/3; p = (5/3,5/3,5/3); e = (-2/3,1/3,1/3) tiene ela = O, 
b) ablara e E p = (1, 3, 1) =b be (0, o, 0). 


1 | A E 0 E O! 
19. P, =- 1 1| =P? y Pb=25|5|.P.=13 9 3] y 
de E 315 E El 


de O: ? 
P,P., = matriz cero porque a; L a,. 
23 PEPE P 
1 y 1 A di 2 4 —2 4 
=3|2. 4 4[+5] 4 4 -2+2|-2 1 -2|=12 
E A 4-2 4 
25. Debido a que A es invertible, P = A(ATA)J71A? = AATLKAB UAT = ]: proyectar 
sobre todo R?. 


MES EE A A 
A O A O 4 4 -—21 


wW] 


Conjunto de problemas 3.3, página 170 
1. X =2;E? =(10— 3x)? +(5 — 4x)? es minimizado; (4, —3)1(3, 4) =0. 


l 
2.2. [o 
3 


5. b=4,5,9en1= —1,0, 1; la mejor recta es 6 + (5/2)t; p = (7/2, 6, 17/2). 
E 1 0 
12. 12. 121. 

0 -1/2 1 


¿bp => es perpendicular a ambas columnas, 


Min lin Ly] 


TY P=RACATA)"A* 


il 


ll 


9. a) P* =(PPPY = P.Así, P = PP = p?. b) P proyecta sobre el espacio 


Z = (0). 
4. P+0 =1, PQ =0, trasponer a OP = O, de modo que (P — OXP — Q) = P— 
0-0+0O=!/. 
13. La mejor recta es 61/35 — (36/35)t; p = (133/35, 95/35, 61/35, —11/35) a partir 
de C = Dt. 
15. H?* =(I -2PY =1-—4P 4+4P? =]-—4P +4P =]1. Con dos reflexiones se 
obtiene /. E 
a A +12 -1/2 << k 
17. La proyección sobre x + y = O = Proyección sobre (—1, 1) = 12 111 : 


19. La matriz proyección sobre el espacio renglón debería ser AY(AABTIA si los renglo- 
nes fuesen independientes. 
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(4 


ata, —alaz| |x atbl 
21. La mejor recta os | LA L . E + E alb| 


zalaz  alaz| |x 
23. C=(ATA)JTATD, AT =(1-..11,b=(y,,..., ym)” entonces 
E SE o 7 
ATA m 
e E Z 
C 
25. A=|* % “y=lolp=]| 9. 
1 1 1 E 3 
1 24 5 
27. a) ala =m,a b=b,+::* + bj. En consecuencia, x es la media de las bs. b) La 


varianza €s [lell? = Y, (b;—X)?. (0) p =(3,3,3), e =(-2,—1,3), ple =0. 


do Cd 
A A 
A A 


29. (XxX 0" = (ATA) AYI[OÓ — AXOb — AXIUIACATA)”!. Para errores in- 
dependientes, al sustituir (b — AxXb — Ax)" = g?] se obtiene la matriz de cova- 
rianza (ATA) ATo?A(ATA)”? Esto se simplifica a v%(ATA)7! fórmula clara para 
la matriz de covarianza. 


A 


UW | pus 


1 A 1 
31. —bi + Pr 3 en + b10). 


10 10 
1 e 0 1 
LES O A 
33. 103 | + E: Al cambiar el miembro derecho por p 13|' x | A se 
1.4 20 E7 
resuelve AX = p. 
e e 
35. Parábola más próxima: ; 9 D| = g | 
1 4 16 Ll l20 


0 

1 

3 

7 
ATAR = a E | 
26 92 mE 400 


37. a) La mejorrectaesx= 1 + a que pasa por el punto central (2, b) = (2,9). b)Con 
base en la primera ecuación Cm + DO” t¡ = > b,. Se divide entre m para obtener 


C+Df =b. 
q wib,+ +++ + wóDbm 
39, Xy = —__—_AAMM 


wi+-* +wl 


41. hw = (1/21,4/7); Añw = (1/21, 13/21, 25/20, 
b— Añy =(-1/21, 8/21, -4/2D), (Añy)WTW(b — Añy) =0. 


1 


Conjunto de problemas 3.4, página 185 


. Y 43€ = 2D, == CD 1 >=CECrFD0=C 2D. 9) La mejor recta, 
—2 + t pasa por todos los cuatro puntos; E? = 0. c) b está en el espacio columna. 
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3. 


1. 


13: 


15. 


A 


d 


19. 


21. 
23. 
25. 


27. 


29. 


2. 


Bl (1 uu) (E —2uu?) = [| —4uu! + 4uu uu! =][; O = 


Proyección sobre az: (—2 / Ll / e / 3); la suma es b mismo; observe que a,al, azal, 
azal son proyecciones sobre tres direcciones ortogonales. Su suma es la proyección 
sobre todo el espacio y debe ser la identidad. 


Njm Ni" nj ni 
Ni Ni pales jr 


Ni pie pira puja. 
4 


Pl Ni of. tj 


(a+ aa a E ERAS Aa IDA > bb 


2 +. . 2 
> e peo 


. La combinación más próxima de qy es Oq, + 0Og,. 
O es triangular superior; la columna 1 tiene q11 = +1; por ortogonalidad, la columna" 


2 debe ser (0, +1,0,... ); por ortogonalidad la columa 3 es (O, O, +1,... ); y así su- 
cesivamente. 


JO O 1 AA IS! y O 
A a E 
1 AS 1 0 07210: 07 1 
1/3 2/3 —2/3 
q =| 2/3l,q, = |1/3l,q3 = | 2/3| está en el espacio nulo izquierdo; 
—2/3 PES 1/3 


a EH Ñ 2) 

Rx = Q*b proporciona b 7 2 | = En y X= E! 

C* — (g7C*) qa es c— (qc) 1 — (970) q2 porque gg, =0. 

Por ortogonalidad, las funciones más próximas son O sen 2x = 0 y O + Ox = 0, 
ade 1/2, di — O, by E 2 /me 

La recta más próxima es y = 1/3 (horizontal, ya que (x, 12) = 0 


(1/42, -1/42, 0, 0), (1/46, 1/46, 2//6, 0), 

(-1/243, -1/243, 1/243, —1/43). 

A=a=(1,-1,0,0),B=b=p= (3,3, -1,0);C =c—-pa-ps= (3,1, 1, —1). 
Observe el patrón en estos vectores ortogonales A, B y C. Luego, (1, 1, 1, 1)/4. 


a) Verdadero b) Verdadero. Qx= x1q,+x2G2. 1 Qx 1? = x? +x2 porque qq = 0. 


Conjunto de problemas 3.5, página 196 


3 
5 


A IDOLO le- JO 50: 70 

0 O O E 

| 0 o 1d 0. 
040.0 0 0 0 16 


La submatriz es Fs. 


e = —1 para x = (2k + 1)rr,e% =i para 9 = 2kxr +1/2, k es entero. 


+8 








Soluciones a ejercicios 0 2 Í 4? 9 
TT ESTO. TO) 


9. a) y =F veces (1, 0, O, 0) = columna cero de F = (1, 1, 1, 1). 
b) c= (1, 1, 1, 1/4. 


1 1 Z Z 
0 Cpar =|1 y =]|0 _|0 

11. c= 1 —> Cimpar = 0 Pa 0 > y = 7 | 
0 O O 0 


13. co=(f+f+f+f1/40= (ff f+i1f0/4, 0 =(f-A+f—f)/8, 
c3=( fo + if —f—1f3)/4; Fimpar significa fp = 0, f2= 0, fa = —f,. Luego cog= O, 


c2=0, 3 = —c1 de modo que c también es impar. 
1 1 1 1 
E 1 LEE qe 1 1 1 1 

¡AREA he E = =p 

15. E 1 2 pais -1 at 
1 Lepe —| Í 
Jl 1 1 1 
17. D= par i/6 | A Y 
par itó ] ¿ti part 


Quel 
19. A = diag(1, 1,12,1%); P=|0 0 y PTllevaaAi-1=0, 


O O 


21. Valores característicos eq =2-1-1=0, e =2-i—-¡%=2, e =2-(-1)- 
(1) = 4, es =2-—i% — 1” =2 Compruebe traza0+2+4+2=8, 

23. Las cuatro componentes son (cy + c2) + (c, +3); luego, (co — c2) + ic] — C3); 
luego, (co + c2) — (c1 + c3); luego, (co — c2) — ¿(c¡ — C3). ¡Estos pasos son la TFR! 


Conjunto de problemas 4.2, página 206 


1. det(24) = 3 y det(—A) = (— Dódet A = 5 y det(4?) = ¿ y det(A7?) = 2. 

3. Por la regla 5, las operaciones en los renglones dejan sin modificar a det A. Luego, al 
multiplicar un renglón por —1 (regla 3) se obtiene la regla del intercambio de renglo- 
nes: det B = —det A. 


5. Para la primera matriz, con dos intercambios de renglones se obtiene la matriz identi- 
dad. La segunda matriz requiere tres intercambios de renglones para llegar a /. 
7. det A = 0 (singular); det U = 16; det U* = 16; det UT? = 1/16; det M = 16 (dos in- 
tercambios). 
9. El nuevo determinante es (1 — m£)(ad — bc). 
11. Si [det O] no es 1, entonces det Q” = (det O)” se inflaría o tendería a cero. Pero OQ” si- 
gue siendo una matriz ortogonal. Así, det O debe ser 1 o —1. 
13. a) Con la regla 3 (factorizar —1 de cada renglón) se obtiene det (K5) = (— 1 det K. 
Así, con —det K = det K* = det K se obtiene det K = O. 


0 0-0 1 
b) ; Be e . tiene det = 1. 
1 0.000 
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E: 


E 


19. 


21 


+ 


23, 
25. 


27 
29, 
31, 


33 


35: 


Sumar cada columna de A a la primera columna la hace una columna cero, de modo 
que det A = O. Si la suma de todo renglón de A es 1, entonces la suma de todo renglón 
de A — [es cero y det (A — D) =0. 


1 
Sin embargo, det A no debe ser 1: 4 = p ] tiene det (A — / = O, aunque det 
A=0%1. 212 
det(A) = 10, det(A7!) = L, det(A —AD) =14—71 +10 =0 parad = 5 y 
A =2,. 


Al tomar determinantes se obtiene (det CXdet D) = (—1)"(det DXdet C). Para n par 
el razonamiento fracasa (porque (—1)" = +1) y la conclusión es errónea. 

d =D 
det(A7l) = der [ad bc ad=b0| - ad = be l 


a | “(ad=bc ad-bc 
ad=bc  ad- bc 
Determinante = 36 y determinante = 5. 


det(L) = 1, det(U)= —6, det(4)= —6, det (UTILT!) = —1, y 
det (ULA) =1. 


Renglón 3 — renglón 2 = renglón 2 — renglón 1, de modo que Á es singular. 
A es rectangular, de modo que det(A41 4) % (det 4T)(det 4): éstas no están definidas. 


Los determinantes de Hilbert son 1, 8 X 107?, 4.6 x 107*, 1.6 Xx 107?,3.7 x 1071, 
54X107%,4.8xX 107%, 2.7x107%, 9.7xX107%,2.2x 107%, Los pivotes son ra- 
zones de determinantes, así que el décimo pivote está próximo a 107/1078 =1071; 
demasiado pequeño. 


Los determinantes más grandes de las matrices 0— 1 paran = 1,2,...,son1,1,2,3, 
5, 9, 32, 56, 144, 320, en la página web www.mathworld.wolfram.com/Hadamards- 
MaximumDeterminantProblem.htm/y también en la “On—Line Encyclopedia of Inte- 
ger Sequences”; www.research.att.com. Con —1s y 1s, el determinante de 4 por 4 más 
grande es 16 (consulte Hadamard en el índice). 


det(1 + M) = 1 +a+bw+c + d. Reste el renglón 4 de los renglones 1, 2 y 3. 
Luego, reste a(renglón 1) + b(renglón 2) + c(renglón 3) del renglón 4. Al hacer lo an- 


terior, se queda con una matriz triangular con 1,1,1,y 1 +a+b>+c=w+den su dia- 
gonal. 


Conjunto de problemas 4.3, página 215 


Le 


a) 412421434443 = 1; par, de modo que det A = 1. 
D) bizbab31b14 = 18; impar, de modo que det B = — 18, 


. a) Verdadero (regla del producto). b) Falso (todo 15). 


c) Faiso (det[i 1 0:;0 1 1;1 O 1] =2). 


. El cofactor 1, 1, es F,..¡. El cofactor 1, 2 tiene un 1 en la columna 1, con cofactor 


F,,—2- Multiplique por (— 1)!*? y también —1 para encontrar F,, = F,, ¡+ F, 2. Así, 
los determinantes son números de Fibonacci, excepto que F, es el F,, _., de costumbre. 


. Desarrollo por cofactores: det = 4(3) — 4D) + 4-4) — 40D = -12. 








DL, 


13. 


15. 


17. 


10. 


21. 


23. 


25. 


27. 
29. 


31. 


33. 


35. 


37. 


39, 
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. a) (a — Dn! (cada término n — 1). b) (1 zp ++ y) n! 
n=! 


c) zon + 2n — 3). 


E A AA A 
AB Bd a a o co EN a 


AB Al _ de al e, Y O 
det| 0 A] = det (4B). Compruebe A =[1 2], B= Al det e 3 =3Í5 = 


det(AB), A = 2 B = [1 2], det a e = 0 = det(4 B). Singular: 
rango (AB) < rango (4) <n <m. 


det A =1 + 18 + 12 -— 9 — 4 — 6 = 12, de modo que los renglones son indepen- 
dientes; det B = 0, por lo que los renglones son dependientes (renglón 1 + renglón 
2 = renglón 3); det C = —1, C tiene renglones independientes. 

Cada uno de los seis términos en det Á es cero; el rango es cuando mucho 2; la colum- 
na 2 carece de pivote. 

411473432044 tiene —, 44473032441 tiene +, de modo que det 4 = O; 
detB=2:4:4:2-— 1:4:-4-1=48, 

a) Siay; = €22 = az, = O, entonces es seguro que cuatro términos son cero. 

b) Quince términos son cero. 

¡Algún término aj.d2g : * : An, en la gran fórmula es diferente de cero! Mueva los ren- 
glones 1,2,...,n hacia los renglones £,..., w. Por tanto, estas as distintas de cero 
están sobre la diagonal principal. 

4!/2 = 12 permutaciones pares; det (7 + Pya,) = 1604 00 (16 proviene de l + [. 


0 AS 050 1 
C=|2 4 2| y AC T=]|0 4 0] = 47. En consecuencia, 47! = CT. 
DTS 0.04 ús 

(Bai 14 AL Ra DS = 1, 


Es necesario escoger 1s de las columnas 2 y 1, de las columnas 4 y 3 y así sucesiva- 
mente. En consecuencia, n debe ser par a fin de tener det A4,, * 0. El número de inter- 
cambios es 41, por lo que C,, = (- 1%. 

Si = 3, S2 = 8, 53 = 21. Parece que la regla es que cada segundo número en la suce- 
sión de Fibonacci... ,3,5,8, 13, 21, 34, 55, ... , por lo que la conjetura es 54 = 55. 
Los cinco términos diferentes de cero en la gran fórmula para S¿ son (con números 3 
donde el problema 39 tiene números 2) 81 + 1-9-—9-—9= 55, 

Al cambiar 3 por 2 en el vértice el determinante F»,,.. 2 se reduce por 1 multiplicado 
por el cofactor de ese elemento del vértice. Este cofactor es el determinante de S,,..., 
(un tamaño menor), que es F»,. En consecuencia, al cambiar 3 por 2 se modifica el de- 
terminante a Fon+2 — Fon Que es Fans 1. 

a) Todo det L = 1; det U, = det A, = 2,6, —6 parak= 1,2, 3. 

b) Pivotes S, É, 2. 

Los seis términos son correctos. Renglón 1 — 2 renglón 2 + renglón 3 = 0, de modo 
que la matriz es singular. 

Los cinco términos diferentes de cero en det A = 5 son 


DOM + ADE-DDED- EoicEDRE - Ri 11) 
= (2D DO). 


A AAA A 
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41, 


43. 


Con a,, = 1, el determinante de la matriz —1, 2, —1 es det = 1 y la inversa 
(AD, = n +1 — máx (G, J). 

Al restar 1 del elemento a, n se resta su cofactor C,,,, del determinante. Este cofactor 
es Con = 1 (la menor matriz de Pascal). Al restar 1 de 1 se obtiene O. 


Conjunto de problemas 4.4, página 225 


pe 


3. 


d: 


1. 


13, 


15. 
7. 


19, 


21. 


23. 


25, 


27. 


29, 


31. 


20 —10 -—12 a 207 10-12 
detA =20:C0* = | 0 5 0 ¡ACT= 201,4 = 0 0 5 0 
0 0 4 A SE! 


39) albad De), cad =D) (A yy 2) = (7 Lo 2) 
a) El área de ese paralelogramo es det E A , por lo que el área del triángulo ABC 


es 54 = 2. b) El triángulo A'B"C" tiene la misma área; simplemente se ha movido ha- 
cia el origen. 


. Los pivotes de A son 2, 3 y Ó a partir de los determinantes 2, 3, y 36; los pivotes de B 


son 2, 3 y O. 


. a) P? lleva (1, 2, 3, 4, 5) a (3,2, 5, 4, 1). 


b) P7! lleva (1, 2, 3, 4,5) 243, 4, 5, 2, 1). 

Las potencias de P son todas las matrices permutación, por lo que finalmente una de 
esas matrices debe repetirse. Si P” es la misma que P*, entonces P'”* = I 

a) det A = 3, det B, = —6, det Bz = 3, de modo que x, = 6/3 = -2yx= 
3/3=1. b) [A] = 4,1B,| = 3,1B,] = —-2,1B3| = 1. Por tanto, x, =% x= -—1 
Y X3= q 

a)x¡ = a Y Xx = É: no hay solución. b)x; = 2 y xa = o: indeterminada. 

Si la primera columna de A es también el miembro derecho b, entonces det A = det 
B,. Tanto B, como By son singulares, ya que se repite una columna. En consecuencia, 
xx =1B,1/14] =1y x=. =0. 

Si todos los cofactores = O (incluso en un solo renglón o en una sola columna), enton- 


ces det A = 0 (no hay inversa). A = Él Ll no tiene cofactores cero pero no es inver- 
tible. 

Si det A = 1 y se conocen los cofactores, entonces C* = A”? y también det 47! = 1. 
Debido a que A es la inversa de A7?, A debe ser la matriz de cofactores de C. 

Una vez que se conoce C, el problema 22 proporciona det A = (det C) 1 conn= 4, 
Así, es posible construir A”? = CP/det A usando los cofactores conocidos. Para en- 
contrar Á es necesario invertir. 

a) Cofactores C7; = C3, = Cy =0. 

b) Cu +. Ca, Ca a Cia, Cx e Ca hace simétrica Ay 


a) Área E A = 10. b) Área del triángulo = 5. Cc) Área del triángulo = 5. 














, 2d > E 

a) Arealj3 4 1| =5.b)5 + nueva área del triángulo 1] o s 1l|=5+7=12. 
dá 211 01 

Las aristas del hipercubo tienen longitud Y1 +1 +1 +1 = 2. El volumen det A es 


2* = 16. (H/2 tiene columnas ortonormales. Así, det (H/2) = 1 lleva de nuevo a det 
H = 16). 





Rs e eo nr a DEL. LIRCAY 
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A 2 35471 / 23803 
os - nee anal caVi o HettáKgulos A+ B + .D (not C). 
SN 'B_ Areas de mismas rectangulo A = 2(triángulo a) 
> bases y mismas rectangulo B = 2(triángulo b) 
D alturas rectangulo D = 2(triángulo d). 







Ta T1 Por lo que los triangulos a +b+d= 3(11Y2 — 2241). 


Compruebe un ejemplo con (a, b) = (3, 2), (c, d) = (1, 4) y área = 10. La recta des- 
de (0, e) en el paso 3 tiene pendiente c/ a y su ecuación es y = e + cx/ a. ¡El paso 3 
funciona porque (b, d) está en esa recta! d = e + cb/ a es verdadera, ya que ad — 
bc = área ae en el paso 2. 


35. El cubo n-dimensional tiene 2” vértices, n2””! aristas y 2n caras de dimensión n — 1. 
El volumen del cubo cuyas aristas son los renglones de 2/ es 2”. 
37. J = r. Las columnas son ortogonales y sus longitudes son 1 y r. 


dr/dx Ir/dy me: 
90/0x 30/9y (—sen6)/r (cosó)J/r|  r' 


41. S = (2, 1, — 1) proporciona un paralelogramo, cuya área es la longitud de un produc- 
to cruz: [PO X PSI| = || (2, —2, —1)]] = 3. ¡Esto también proviene de un deter- 
minante! Los otros cuatro vértices podrían ser (0, 0, 0), (0, 0, 2), (1, 2, 2) y (1, 1, 0). 
El volumen de la caja inclinada es |det| = 1. 


cos 9 sen 6 1 


— 
— 


39 











NI 
43. det|3 2 1| =0=7x-—3y +2; el plano contiene dos vectores. 
LL 23 


45. VISA tiene cinco inversiones VI, VS, VA, IA, SA. Y AVIS tiene dos inversiones Vl y 
VS. Debido a que 5 — 2 es impar, VISA y AVIS tiene paridad opuesta. 


Conjunto de problemas 5.1, página 240 

1. 1=2yA4= 3; traza = 5, determinante = 6, 

3. A=-—3y4A4 = —4; las dos As son reducidas por 7, con vectores característicos sin mo- 
dificar. 

5. 1=3,14=1,1 = 0, con vectores característicos (1, O, 0), (2, —1, 0), (G, —2, 1); traza 
=4 dt =0.1=2,1A=2,A4 = —2, con vectores característicos (1, 1, 1), (0, 1, 0), (1, 
O, — 1); traza = 2, det = —8. 

7. Ax = Ax proporciona (A — 71)x = (A — 7)x; Ax = Ax proporciona x = A47!x, de 
modo que A7*x = (1/4)x. 

9. El coeficiente de (—A1)7*en (A, —A)---(A,—A)esA + ** +A. En det (4 —AJ), 
un término que incluye un a; fuera de la diagonal excluye tanto a a, — A como a 
as — A. Este término no implica a (—4)”7?. Así, el coeficiente de (—A)””* en det 
(A — Af) debe provenir del producto bajo la diagonal principal. Ese coeficiente es 
au tran =A + 0d. 

11. Trasponga A — Af: det(A — AL) = det(4 — AD? =det(AT — AL). 

13. Los valores característicos de A son 1, 2, 3, 7,8, 9. 

15. rango(A) = 1,14 =0,...,0,n (traza n); rango(C) =2,1=0,...,n/2, —n/2 (tra- 
za O). 

17. El tercer renglón contiene a 6, 5, 4. 
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19. A, A? y A” tienen los mismos vectores característicos. Los valores característicos son 


21. 


23. 


25. 


27 


29. 


31 


33 


35 


37 


39 


a 


e 


. 


1 y 0.5 para A, 1 y 0.25 para A? y 1 y O para A. En consecuencia, 4? está a medio ca- 
mino entre A y A”. 

A = 4 yA, = —1 (compruebe la traza y el determinante) con x, = (1,2) y x2 = (2, 
—1). A”? tiene los mismos vectores característicos que A, con valores característicos 
a) Multiplique Ax para ver Ax, lo cual revela a A. b) Resuelva (4 — Ax = O para 
encontrar x. 

a) Pu = (uuD)u = u(u Tu) = u, de modo qued = 1. b) Py = (uuu = u(uy) = 0, 
así que 2 =0. € x; = (-1,1,0,0), x2 = (-3,0,1,0), x3 = (—5,0,0, 1) 
son ortogonales a u, por lo que son vectores característicos de P con 4 = 0. 

A — 1 =0 proporcionaA = 1 y A = 3(—1+ 1/3); los tres valores característicos 
soni. == 


a) rango =2. b)det(BTB) =0. Noc). d) (B+D"'tiene(a + 1)! =1,3,1. 


a=0,b=39,c = 0 multiplican a 1,4, 1% en det(A —11) =94-—A3: A = matriz 
acompañante. 


o lo o 


ton). 


de 1 Siempre A? = matriz cero si A = 0, 0 (Cayley-Hamil- 


Ax = CIAyx¡+ *** + ChAnx, es igual a Bx = c/41x1+ *** + CrAnx, para toda x. 
Así, A = B. 


a asia a +b 1 
pm vue . — = — $ 
b 2 H E E de = (a + b) Al 22 = d — b para obtener traza = a + d 


Se requiere A? = 1, pero no A = 1 (para evitar 1). Con A, =e23 y 22 = e 27813, 


el determinante es 4117 = 1 y la traza es A; +22=cos Z +isen*Y + cos $ — 


¡sen = —1. Una matriz con esta traza —1 y determinante 1 es A = e e 


Conjunto de problemas 5.2, página 250 


chai=b ab dh: 


lll) 


1 


. A =0,0, 3; la tercera columna de $ es un múltiplo de | 1 | y las otras columnas están 


sobre el plano ortogonal a aquélla. 1 


- No es posible diagonalizar a 4, y A. Sólo tienen una recta de vectores característicos. 


a ls ole alo 
; a=| Sá ñ h Es proporciona 


O 


al OS O BS SS 
A 0 AE 1 al 510 -3 








11. 


13, 


153. 


dí 


19: 


21. 


23. 


25, 


27. 


29. 


OL 


3% 


35. 


2 YE 


7 


41. 
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. Traza(AB) = traza (BA) = aq + bs + cr + dt. Así, traza (AB — BA) =0 (siempre). 


Por tanto, AB — BA = J es imposible para matrices, ya que la traza de / no es cero. 


¿ES SN 1.0.0 
a) Verdadero; detA =2 +0. b) Falso; |0O 1 1|. c<) Falso; 0 1 0lesdia- 
gonal! Os bo 2 05502 
MS E Y 01 A a e a , 
A= B El y 4 E El : 7 2 cuatro raíces cuadradas. 


ul ra Lo je 
A. 


PAE gp 
a=lo lo slo 1)" bo 5 


a) Falso; no se conocen As. b) Verdadero. c) Verdadero. d) Falso: ¡se requie- 
ren vectores característicos de S! 

Las columnas de S son múltiplos de (2, 1) y (0, 1) en cualquier orden. Lo mismo para 
A 

AyBtieneni; =1yA4,=1.A4 + B tiene A; = 1 y A = 3. Los valores característi- 
cos de A + B no son iguales a los valores característicos de A más los valores carac- 
terísticos de B. 

a) Verdadero. b) Falso. Cc) Falso (A podría tener 2 o 3 vectores característicos in- 
dependientes). 


SS _ 19 4 0 Ea 
A = Es y (u otra), A = Ñ 4 l: A = ho ojos Únicos vectores caracte- 
rísticos son (c, —cC). 
SAFS”? tiende a cero si y sólo si todo lA] < 1; B* > 0 desde A =0.9 yA = 0,3. 


_ fos 01 ._f3 -3] 31 3 3) _ 3 
2-1 03 += or oo e"[] oa 


B b = suma de estas dos. 


pt = |) OS A A 3 —2* 

IS SA NS 1 A! 0 Pa | 
Traza AB = (aq + bs) + (cr + dí) = [qa +rc) + (sb + 1d) = traza BA. Dermostra- 
ción para el caso diagonalizable: la traza de SAS”? es la traza de (AS7ID)S = A, que 


es la suma de los As. 

Las As forman un subespacio, ya que cA y A, + A, tienen la misma S. Cuando S = f, 
las As proporcionan el subespacio de las matrices diagonales. Dimensión 4. 

Dos problemas: el espacio nulo y el espacio columna pueden traslaparse, por lo que x 
podría estar en ambos. En el espacio columna podría no haber r vectores característi- 
cos independientes. 


2 
qa b o tiene A? = h E y A? — A — 1 = matriz cero confirma el teorema 


de Cayley-Hamilton. 
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43, 


45. 


Por 5F, B tiene los mismos vectores característicos (1, 0) y (0, 1) que A, por lo que 5 


0 

es diagonal. Las ecuaciones AB — BA = A A o E y son 
26 328 c 28 0 0 

=b=0yc=0: rango 2. 

Á tiene 1, = 1 yA, = 0.4 con x, = (1, 2) y 12 = (1, —1). 4” tiene, =1y4=0 

(mismos vectores característicos). A'% tiene A, = 1 y A, = (0.4)1%, que está próximo 

a cero. 


Conjunto de problemas 5.3, página 262 


1. 


Los números de Fibonacci comienzan par, impar, impar. Así, impar + impar = par. 
Los dos siguientes son impar (de impar + par y par + impar). Luego se repite impar 
+ impar = par. 


RA h q q 2 A At = E >) FA= 6165. 


ES =t 1 l pe 1 Ay Az Ar 0 1 q —A2 -| 
:. A=SAS le o ESE E 1 A A (observe S”*). 





sata 1 [4 Hi Al a lA 2 f0_] -=-=--- | 
a O O O (A — AL) /(A1 — 2) 


La suma directa L, + Ly, proporciona Lo, . . ., Lip como 2, 1, 3, 4, 7, 11, 18, 29, 47, 
76, 123. Con mi calculadora obtengo 11% = (1,618...)'% = 122.991..., que se 
redondea a Lip = 123, 


ZA 
e 0 
12 6 
9. La matriz de transición de Markoves | ¿ 3 0|. Las fracciones 2,1 y 1 no se 
mueven. | 
yea 
M. a) 1=0, (1, 1, —-2).b)A = 1 y —0.2, c) límite (3, 4, 4) = vector característico para 
= 1. 
O<as<l 
13. a) DE 29 
bá=ay 1] [Y 0 ba=a 11*h 
b) uy = k 
1 ==] O (a—b) 1 =1 1 
2b END b 
e 
4 a A e DS El 
o a 
2b 1/3 
A E a otra a = 
C) ul > oi sila=b[| <l;: b=-1/3 
21 —a) no es de Markov. 
b-—a+l 
ES, 


qe 


La suma de las componentes de Ax es x, + x, + x3 (la suma de cada columna es 1 y 
no se pierde nada). La suma de las componentes de Ax es A(x, + 1 + x3).5147% l, 
Xy + Xx + x3 debe ser cero. 


p q es inestable para [a] > 1/2, y estable para [a] < 1/2. Es neutra para y = +1/2. 
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0.0 2 ¡NS 
19. 44=|0 O O|yA =0.Así, (1-AJ'=I+A+A* =|0 1 11. 
00.000 0:50: 1 


21. SiA se incrementa, entonces se consumen más bienes en la producción y la expansión 
debe ser más lenta. En términos matemáticos, Áx > fx debe seguir siendo verdadera si 
Á se incrementa; fm4, se va para arriba. 


El 0 


25. R=SYAS” = h A tiene R2= A. YB debería tener 2 = /9 y 1A= YI, 


2 


e 


Z 
por lo que su traza no es real. Observe que É : a puede tener /—L=1 Y =1,y 


una raíz cuadrada real de o: 


27. A=SA¡ST? y B = SA2S”!. Las matrices diagonales siempre proporcionan 
A¡Az = A2A;. Así, AB = BA, a partir de SA¡STISA2S7! =SA¡A2957? = 
SA2A1S7?! =SA2S  SA¡S7! = BA. 

29. Btiene A = iy —i, de modo que B* tiene 14 = 1 y 1; C tiene 1 =(1+Y431/ 2 = 
exp(+ri/ 3), por lo que 1? = —1 y —1. Así, (% = —Iy C1'2%=-—C, 


Conjunto de problemas 5.4, página 275 
1. Ay = —=2:Y Az = 00 — 5 11 Yo — (1, 1 
ai et+1-er+1 
E PE A RT 


3. u(t) = En 1 a Cuando 1 > 00 el > +00 
e +2|' 


5. a) pat +T) = SeMe+T) 91 = SeMteAT g-1 == Set S7159947 g-1 = epa. 


y za E E O 1 
b) e I+A h 1% 1+8= |, ¡para =| 0 


proporciona g1+B = jos 1 —sen , a partir del ejemplo 3 en el texto, en £ = 1. 


sen 1 cos 1 
Esta matriz es diferente de e*ef, 


1 df +3 
A == SOÑE E 
e I + At F 4| e“ u(O) | 4 . 





%.31=14% 1 = 24 Rea, > 0, inestable. b) A: = V7,12 = —47, 
Rei, > 0, inestable c) A, = HR, > A ReA;, > 0, inestable 
d) 11 = 0,42 = —2, neutralmente estable. 

11. A, es inestable para £ < 1, neutralmente estable para £ > 1. A, es inestable para £< 4, 
neutralmente estable en £ = 4, estable con A real para 4 < £ < 5, y estable con A com- 
plejo para £ > 5. Ay es inestable para toda £ > O, porque la traza es 2£, 


13. a) u= cuz — buz, 4, = —cuy + au3, uy = bu; — au, Proporciona y 4 +u5u49 +u4243=0. 
b) Debido a que e” es una matriz ortogonal, lao? = eta? = (0) 14 es 
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15. 


17. 
19. 


yA e 


23. 


20: 
27. 


29. 


31. 


33 


2 


Dd 


+ 


37. 


E 


41. 
43. 


constante. c)1=0y +(Y/a2 + b2 + c?). Las matrices simétricas sesgadas tienen 
As imaginarios puros. 


1 1 4 
ñ + 3 COS J6t Hl 


Ax =AFx+Alx0 bien, (A-AF —-2¿Dx =0 


Los valores característicos son reales cuando (traza)? — 4det > 0 > —4(—a? 
b24+c50)>0>a+b ><. 


u(t) = 3 COS Pas Ñ 


al 


u, =e* o: Uy =e' ib Si u(0) = (5, —2), entonces u(t) = 3e* [9/92 E 


y 4 Sly 
A, =0 yA, = 2. Luego, v(s) = 20 + 10e% — 00 cuando 1 > 00. 


14 = h 5 |. Así se obtiene 1 = (5 + 441). 


-9 6 
diente (1, 3). Así se obtiene y = ce*, y” = 36%, También te? resuelve y” = 6y” — 9y. 


A = | a A tiene traza 6, det 9,1 = 3 y 3, con un solo vector característico indepen- 


y(t) = cos t empieza en y(0) = 1 y y'(0) = O. La ecuación vectorial tiene u = (y, y”) 
= (cos f, —sen £). 

Al sustituir u = ey se obtiene ce"ty = Aetu — ep, o bien, (4 — chv=b,0v= 
(A — cD”*b = solución particular. Si c es un valor característico, entonces A — cl no 
es invertible: esta y fracasa. 


de [dt = A+ AM+ÍA RA AP AL Ar Ar Lado) = 
Ae”, 
La solución en el instante + + 7 también es e44+Dy4(0). Así, e** multiplicada por e** 


es igual a e44+D, 
Si A* = A, entonces e = 1] +At +34? +2A9+--+=1 +(e — DA 


al A et —-] e el —-1 
O 1 0 0 0 1 B 
a 1.11 f3 0/0 5% ina 
A 


ent =0, 
a) La inversa de ese”, b) SiAx= Ax, entonces ex = e Mx y e* 40, 


¡| As, A =SAST = ye Al 


en 2 
A = 2 y 5 con vectores característicos | 1 y F o A > 


Conjunto de problemas 5.5, página 288 


E 


E 


S 


b) suma = 4 + 3i; producto = 7+i¿.  c) 3+4i = 3-—4¿; 1-i = 1+id; 
13 + 41] = 5;|1 —¿= Y/2. Ambos números están fuera de la circunferencia unitaria. 
F=2-¿xxX=35, xy = -1+7,1/x = 2/3 — (1/Dí, x/y = 1/2 — (1/DÉ; 
compruebe que [xy] = 4/30 = |x|] y ]1/x]= 1/43 = 1/|x1. 

a) 1? = ye, xl =(1/NeP,x = re?; x! =X proporciona |x|? = 1: en la 
circunferencia unitaria. 





ad: 


13. 


13 


17. 
19. 


21. 


23 


27. 


29. 


Sd 


33. 


y: 
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A E TAS 


1 ¿ o NS 
ce li=p 0 P | =|-i 1  0|,C% =C porque (ARA) = AHA. 
] 1 


0 1 0 


. a) det AY = det A pero det AF = detA. b) AF = A proporciona det A = 


det A = real. 
pa 0% =1,0 = | 1/Vg 00 = [9 000 =1, 4 = Lom — 
10 E E 0 _ (2/V5 O E O os 
Uva = [ab Ro AG dE 2), 7: 


a) u, v y w son ortogonales entre sí. b) El espacio nulo es generado por u; el espacio 
nulo izquierdo es el mismo que el espacio nulo; el espacio renglón es generado por y y 
w; el espacio columna es el mismo que el espacio renglón. Cc) x =uv — 5u; no es 
único, ya que es posible sumar a x cualquier múltiplo de u. d) Se requiere b*u = 0. 
e) 57! = ST; STIAS = diag(0, 1, 2). 

La dimensión de S es n(n + 1)/2, no n. Toda matriz simétrica A es una combinación 
de n proyecciones, pero las proyecciones cambian cuando A cambia. En el espacio S 
de matrices simétricas no hay base de n matrices proyección fijas. 

(UVIHKUV) = VRYUEUV = VEIV = [. Así, UV es unitaria. 


La tercera columna de U puede ser (1, —2, ¿Y Y6, multiplicado por cualquier núme- 
ro e*?, 
A tiene +1 o —1 en cada elemento en la diagonal; ocho posibilidades. 


. Las columnas de la matriz U de Fourier son vectores característicos de P porque 


PU = diag(1,w,w*,w*)U (y w= il). 


n* pasos para C directa multiplicada por x; sólo n log n pasos para F y F”* por la TFR 
(y n para Á). 


Z 0 li a 
AFA = 0 2 1+i¿| y AñÍ = h A son matrices hermitianas. 
BRE Sd 2 
(AH py = ARRAY = AFA de nuevo. 
cA sigue siendo hermitiana para c real; (¿A) Y = —¡AR=-—i¡A es hermitiana sesgada. 
Uo“Os a 
P? =|1 0 0], P=1, PW% = PPP = P; Ah = raíces cúbicas de l = 1, 
0 1 0 
paria earid3 
Za 3 A 2+5+4 
C=]|4 2 S| =2+5P +4P? tiene AC) = < 2 + Se 03 + 4gtr113 5. 
E 2 + 547013 + 4p3rif3 


POT E MM OS EA A 
Ali+i 1 (0-1 WBb1=i 1] 


1pi -i-=Afa 01]. 1+ 
A ERA 
Es Ar 1 la he 57 A 
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3J 


39. 
41. 


43. 


45. 


47. 


49. 


 111+43 -1+ f1 01][1+Y43  1-¿ 1 
e a P let A pal Loja | een O H2Ya, 


Y = V% proporciona A real, con una unitaria se obtiene [1] =1, de modo que con una 
traza cero se Obtiene A = 1, —1. 

No multiplique e” * por e*; primero conjúguelos, luego E e dx =[e*/21]=0. 
R+iS =(R +18) = RT —1ST*; R es simétrica pero S es simétrica sesgada. 


a b=+ic 


y | con a? +b?4(?x=1. 
ic  —a 


(1) y 1; , 


(1—2uuBDE =1 —2uuB; (I— 2uuByY = [ —4uu* +4u(u*u)Ju?E = 1; la matriz uu? 
proyecta sobre la recta que pasa por u. 
Se tiene A+iB =(A+I1BY = AT —¡BT.Así, A=A* yB=-B?, 

a A a a A PA O A =] z 
A = | ul > | h | 6 E + ¡ + = SAS””. valores característicos rea- 
les 1 y 4. 


Conjunto de problemas 5.6, página 302 


1. 


13. 


AS: 


17. 


19, 


21. 


. La matriz reflexión con base v, y Ves A = 


C=NUBN=N"MT?AMN =(MN) A(MN); sólo M7* | M = [ es semejante 
al 


. SiA1,..., An son valores característicos de A, entonces A, +1,...,A .n +1 son valo- 


res característicos de A + 7. Por tanto, A y A + 7 nunca tienen los mismos valores ca- 
racterísticos, por lo que no pueden ser semejantes. 


Si B es invertible, entonces BA = B(AB)B”! es semejante a AB. 


. El elemento (3, 1) de M7 AM es g cos O + h sen 0, que es cero si tan O = —g/h, 


Los coeficientes son cy = 1l,c2 = 2,d, = 1, d, = 1; compruebe Mc = d. 
Nal 


1 3) La base V, y Y, (¡misma refle- 


xión!) proporciona B = F | SiM = h cl entonces A = MBM”?. 


0 10 0.00 

a) D=l0 O 2|. b D"=]|0 O O0| = matriz de terceras derivadas. Las ter- 
F 0 ] 0.000 

ceras derivadas de 1, x y x? son cero, de modo que D? = 0. c) A = 0 (triple); sólo un 

vector característico independiente (1, 0, 0). 


Estos valores característicos son 1, 1, 1, —1. Matrices características E sl E o 


AT o 


a) TTÉ = UTAUUFAMU DOE =T[. b) Si T es triangular y unitaria, entonces 
sus elementos diagonales son cero porque las columnas deben ser vectores unitarios. 
Los elementos 1, 1 de T*YT = TT* proporcionan |1,11? = l1,11? + [1,212 + l1131?, de 
modo que ft; = £¡3 = 0. Al comparar los elementos 2, 2 de T*YT = TTF se obtiene 
t23 = O. Entonces, T debe ser diagonal. 

Si N = UAU”?, entonces NN? = VAUT (UT HABUE es igual a UAABUF. Esto 
es lo mismo que VAFAUF = (UAUTBDRKUAUT LD = NN. Por tanto, N es normal. 





— NN A A A o a nr ro rai IATA AAA A qu A ar PA RA a ca 0 ot o id pu it lll e aid crohla ade 





23, 


23 


27. 


29. 


31. 


33. 


35 


a 


37. 
39. 


41. 


43 
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Los valores característicos de A(A — DA — 2f) son O, 0, O. 
' [ad +bc ab +bd a b 1.0 0 0 
ness Le cdi be pra eS B . e h ! Ñ b ol 


M” "JM = 0, por lo que las dos últimas desigualdades son fáciles. Al intentar para 
MJ, = JM obliga a que la primera columna de M sea cero, por lo cual M no puede 
ser invertible. No es posible tener J, = M7 *J,M. 


¿10 210 | 61 pa a | 13 a 


—80 -S9 216 en 
A A A A 
0 ob 1 is 1 O' 0 1 , Ó 1 ] 0 . 


a) (MTAMNM"x) = MAX) = MO =0. b) Los espacios nulos de A y de 
M”*AM tienen la misma dimensión. Vectores y bases distintas. 


P= A za, po 6 |, $ a ed JU=1, JU = e pas 
w(t) = (w(0) + 1x(0) + 312y(0) + ¿r3z(0))e*. 

a) Se escoge M, = matriz diagonal invertida para obtener M/*J,M, = M] en cada 
bloque. b) M, tiene estos bloques M; en su diagonal para obtener M¿* J Mo = J7. 
0) A = (MINFIM es (MODNIM; IMM” = (MMoMT) A(MMOMT), y 
A” es semejante a A. 


a) Verdadero: Una tiene A = O, la otra no. b) Falso. Diagonalice una matriz no si- 


1 O 1 


dero: todos los valores característicos de A + f se incrementan por 1, con lo cual son 
distintos de los valores característicos de A. 


métrica y Á es simétrica. Cc) Falso E 3 y : E son semejantes. d) Verda- 


Diagonales de 6 por 6 y de 4 por 4; AB tiene todos los mismos valores característicos 
que BA más 6 — 4 ceros. 


Conjunto de problemas 6.1, página 316 


le 


ES 


ac=b?=2-4=-2<0;x? +4xy +2y? = (x + 2y? — 2y? (diferencia de 
cuadrados). 
det(A—AD) =2 —(a +0)A + ac — db? =0 proporciona A, = ((a + Cc) + 


Y (a — 0? +b2)/2 Y h2 = ((a +0) — yla — 0)? + 4b?)/2); 41 > 0 es una suma de 


números positivos; A, > O porque (a + c)? > (a — cy? + 4b? se reduce a ac > b”. 
Mejor método: el producto 1117 = ac — b?. 


5. a) Positiva definida cuando —3 <b< 3, 


Nr, MEA E 0 1 b a 1 
b) B o = B j o OA F .: c) El mínimo es EC 


1 b X EN 0 x _ 1 pe A | 
F 3 5 Ñ Hl dd «| —9-p | il d) No hay mínimo, sean y —> 00, 


== 3 Entonces a y Hende.a "00: 
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11. 


10, 
15. 


Y7. 


19. 


21 


a O 


-. 3) Ai = 71 1 0 E e A 

—1 1 1 -] —2 11 

b) fi = (x1, — x2 — 1x3)? = 0 cuando x, — x2 — x3 =0. 
1 O 0 
Cd) fi =(x —x2 — 13) + (22 — 3x3? +32; L=|-1 1 Ol 
ae es 


<A <= : | = b i F A E 1 los coeficientes de los cuadrados son los 


6 16 2 1110 4/]0 1 
pivotes en D, mientras los coeficientes dentro de los cuadrados son columnas de L. 
a) Los pivotes son a y c — |b|?/a y det A = ac — lb]?.  b) Multiplique |x»!? por 
to= 151?/ a). <c) Ahora, Ax es una suma de cuadrados. d) det = —1 (indefinida) y 
det = +1 (positiva definida). 
a>1y(a- IXc— 1) > b?. Esto significa que A — 7 es positiva definida. 
fx, y) =x2+4xy +9y? = (a +2y)+5y?; f(x, y) = 1? + 6xy +9y? = 
(x + 3y?. 
xTATAx =(Ax) (Ax) = longitud al cuadrado = O sólo si Ax = 0. Debido a que A 
tiene columnas independientes, esto sólo ocurre cuando x = 0. 


4 —4 8 

A= |-4 4 -—8| sólo tiene un pivote = 4, rango = 1, valores característicos 24, 
8 —8 16 

O, O, det = A. 


ax? + 2bxy + cy? tiene un punto silla en (0, 0) si ac < b?. La matriz es indefinida 
(A <0yA > 0) 


Conjunto de problemas 6.2, página 326 


1. Aes positiva definida para a > 2. B nunca es positiva definida: observe b 5) 


3. 
de 


e 


9. 


11. 


13. 


det A = —2b? — 3b? + 1 es negativo en (y cerca de) b = 4. 


Six "Ax > 0 y x"Bx > 0 para cualquier x 7 O, entonces “(A + B)x > 0; condición (1). 


As positivos porque R es simétrica y YA >0.R = F A R = E y >) 


jxTAy? = xx TRTRyP? = (Rx Ry]? < (por la desigualdad normal de Schwarz) 
RAP IRY 1? = GC PRTROORTRy) = (0 A) Ay). 


3 ==. 1 1 rd 
E tieneA = 1 y 4, ejes 1 pe lo largo de 1 - 
A e a | y je al y A a lo largo de los vec 


tores característicos. 


Matrices negativas definidas: (D) x"Ax < O para todos los vectores x diferentes de 
cero. (1) Todos los valores característicos de A que satisfacen A¿< 0. (ID det 41 < 0, 
det Az > 0, det Az <0. (UV) Todos los pivotes (sin intercambios de renglones) satisfa- 
cen d, < 0. (V) Existe una matriz R con columnas independientes tal que A = —RYR. 
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. Falso (0 debe contener vectores característicos de A); verdadero (mismos valores ca- 


17. 


19. 


21. 
23. 


25. 


27. 


29. 
IL 


33. 


35. 


37 


39. 


41. 


43. 


racterísticos que A); verdadero (2* AQ = 07* AQ es semejante a A); verdadero dos 

valores característicos de e”? son e”?* > 0). 

Empiece desde a; = (renglón ¡ de R5BXcolumna j de R) = longitud al cuadrado de la co- 

lumna ¡ de R. Así, det A = (det R)? = (volumen del paralelepípedo R)? < producto de 

las longitudes al cuadrado de todas las columnas de R. Este producto es a;/a47---a 

A A O | 

A=|-1 2 —1| tiene pivotes 2,5,3,4= |-1 2 —1| es singular, 
Le A EZ 

1 0 

1| = ¡0j. 

1 0 

x"Ax no es positiva cuando (x;, x2, x3) = (0, 1, 0) debido al cero en la diagonal. 


a) La condición de positiva definida requiere un determinante positivo (también que 
todas las A > 0). b) todas las matrices proyección, excepto /, son singulares. c) Los 
elementos diagonales de D son sus valores característicos. d) La matriz negativa de- 
finida —/ tiene det = +1 cuando » es par. 


A, = 1/4? y d =1/0*, de modo que a =1//X y b= 1/17. La elipse 9x? + 
16y? = 1 tiene ejes con semilongitudes a = ¿ yb= ¿. 


o A E 010 a y UE 8 0 0 AS 
a=| > : E ap e= >| tiene e o 


ax? +2bxy +cy? = a(x +2y) o. eE y, 21? +8x y + 10y? = 2(x +2y) +2y?. 


nn -. 


A 


XxX Ax =2(x1 — 3% = l x3)" + 22 192% 7Bx =(x, + x2 +x3)?. B tiene un 
pivote. 
A y CTAC tienen 41 > 0,42 = 0, C(6) = 10 +(1-5HOR,QO = E E 


R = h Al C tiene un valor característico positivo y uno negativo, pero 1 tiene dos 


valores característicos positivos. 
Los pivotes de A — 51 son 2.5, 5.9, —0.81, de modo que un valor característico de 


A — jes negativo. Por tanto, A tiene un valor característico menor que ¿. 


rango(CTAC) < rango A, aunque también rango (CAC) > rango ((CT)YICTACCTI) 
= rango Á. 


No. Si C no es cuadrada, CTAC no es del mismo tamaño que la matriz A. 
641/18 -—3-—A/18]| _ a _ 54 
det So E a = Q proporciona A; = 534,12 = =* 


Vectores característicos al Hl 


Grupos: matrices ortogonales; e? para toda 1; todas las matrices con det = 1. Si A es 
positiva definida, el grupo de todas las potencias A* contiene sólo matrices positivas 
definidas. 
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Conjunto de problemas 6.3, página 337 


E 


3. 


ES. 


17. 


19. 


A=[yo 39) 0d = 8500m [5] de meso que vs [1/50 


A El 
A E 

A = A, los vectores característicos de A*A son los mismos que para A. Debido a que 
ES 0 —/3) es negativa, 0, = A, pero O, = —A>. Los vectores característicos 

unitarios son los mismos que en la sección 6.2 para A, excepto por el efecto de este 

signo menos (ya que se requiere Av, = (24): 


Ai 1H 1? dal 41H A? 
ÍA ] y 1 0 JJ 








AA = h : tiene valores característicos y? = . Como 


UTE UYV1+I 
AA Y , | Hiene 0 =3 con u; 75 Y oy = 1 con ua 1/43 | 
¡E 1/46 1/42 
ATA=|1 2 1 tiene 0? = 3 con Y = 2/46 |,0? = 1 con Y) = 0 ; 
O 1/46 1/42 
1/43 
y vector nulo, vz = |-1/43 |. 
1/43 
NO 0 
Así, b 1 A = (4, 42) ea 1 o [uy vu]. 


. A = 12uv” tiene un valor singular o, = 12. 


Multiplique UEV* usando columnas (de U) multiplicadas por renglones (de 2V 7). 


. Para hacer singular a A, el cambio más pequeño iguala a cero su valor singular más 


pequeño, 0». 


. Los valores singulares de A + 7 no son 0; + 1. Provienen de valores característicos de 


(A+ DFCA +1. 


E 
E 


LSO od 
pra de[e-| 
050 al 0 0 


Ni ja 
= ¡am 


E E 


A” es la inversa derecha de A; B” es la inversa izquierda de B. 


1 a 
ALAS a ba Sd h % Pi ls E ||» tome las raíces cuadradas de 4 


E E A OA a 
y 16 para obtener 5 = || 3 b H 8 = JE 


O =AS” “hl 3 q 
Vio |-1 31 

a) Con columnas independientes, el espacio renglón es todo R”; compruebe (4*4) 

A*b=ATb. b) AMAABDTID está en el espacio renglón porque en este espacio se 

multiplica A* por cualquier vector; así, (A7A) ATb = ATAAT (AA) Ib = ATb. Con 

ambos casos se obtiene ATAx* = ATb, 











Lidl 


21. 


23 
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0 0 1 0 0 


0 Aa 0 
ol 0 
A = Q¡X1Q]! > A* = 02E*0T > AA? = Q,EX* OT. Al elevar al cuadrado se 
obtiene (AAFY? = Q,1EFEEN*OT =Q ¡EN XE*O? y de manera semejante para 


(AAFY? =AA*? =C(AAF) y AFA proyectan sobre el espacio renglón y el espacio 
columna de A. 


Tome Á = b ] y B= B yA AB = E : A partir de C* en el proble- 


ma 15 se tiene A* = | 


ja ja 


| =(AB)", y (AB)* AB?A?. 


Nr 0 jr 


Conjunto de problemas 6.4, página 344 


1. P(x) = x2— x1x2 + xd — x2x3 + x2 — dx, — 4x3 tiene 0P/0x, = 2x, — x2 — 4, 


3. 


11. 


13, 


15. 
17. 


. Debido a que x 


IP/Bx2 = —x1 + 2x2 — X3, y 9P/9x3 = TZ —* 
Con 3P,/9x =x +y=0Y 9P¡/dy =x +2y — 3 =0 se obtiene x = —3 y y = 3. 


P» no tiene mínimo (sea y > 00). Está asociado con la matriz semidefinida E ol 


. Escriba x = (1,..., 1) enel cociente de Rayleigh (el denominador se convierte en »): 


Debido a que R(x) siempre está entre A, y A,, se obtiene 1), < "Ax = suma de todas 
las Aj; € NA. 

TBx > 0 para todos los vectores x diferentes de cero, “(A + B)x es ma- 
yor que x*Ax. Así, el cociente de Rayleigh es mayor para A + B (de hecho, todos los 


n valores característicos se incrementan). 


. Debido a que x"Bx > O, el cociente de Rayleigh es mayor para A + B que el cocien- 


te para A. 
Los valores característicos más pequeños en Ax = Ax y Ax = AMx soni y (3 — Y3 4. 
a) A, = miínsj[MáXy en s¿RQ)] > O significa que toda $; contiene un vector x con 


RG) > 0. sanos xx 

El subespacio extremo $, es generado por los vectores característicos Xx, y Xz. 

Si Cx = C(A71b) es igual a d, entonces CA7*b — d es cero en el término de correc- 
ción en la ecuación (5). 


Conjunto de problemas 6.5, página 350 


Ze Ol 13/16 1/2 
1. Ay=bes 4 |-1 2 —1)] [4/16] = b = |1/2|. El elemento lineal finito 
0-1 Zl 3/16 172 
U=%V + EV. + ¿V, es igual a la u = £, £, E exacta en los nodos x =Í, 1,3, 
ZA 0 1 2 
3. As =3,b3 = 3.Así, A = 3 E Z ni Zola 
Ol 1 1 
1 3 
Ay = b proporciona y = —- |8|. 
ES 


468 
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5. Integre por partes: f,— V/V,dx = f V/V¡dx-— [VW], = SoV/Vjdx = 
misma Á 
Te = 4, M = 5. La razón 12 (el cociente de Rayleigh sobre el subespacio de múlti- 


2 de V e es mayor que el valor característico verdadero A = 1. 


. La matriz masa M es h/6 veces la matriz tridiagonal 1, 4, 1. 


Conjunto de problemas 7.2, página 357 


1. 


11. 


ES: 
iS, 


y7, 


19, 


74 


2 


25. 


S1 Q es ortogonal, su norma es [| O || = máx [1 Ox] 7 lll] = 1 porque O preserva la lon- 
gitud: [|[Ox|] = llx]| para toda x. O”? también es ortogonal y su norma es 1, de modo 
que c(O) = 1. 


. NABxI < 11411118x]|, por definición de la norma de A, y así l|Bxl| < 1181) HlxH. Al dividir 


entre |x|] y maximizar, ABI < 1141111811. Lo mismo se cumple para la inversa, 
NBA] < 1B7 NAT]; (AB) < c(4) c(B) al multiplicar estas desigualdades. 


. En la definición JA ]] = máx JlAx]| 7 llxll, x se escoge como el vector característico par- 


ticular en cuestión: [Ax]] = [A] lx ]|, de modo que la razón es |A| y la razón máxima es 
por lo menos |A]. 


. ATA y AA” tienen los mismos valores característicos, ya que con ATAx = Ax se obtie- 


ne AAT(Ax) = ACATAX) = A(AX). La igualdad de los valores característicos más gran- 
des significa ]14 1] = par ll. 


a b yl pe h al AS E EN Aque SO) 


0 0 1 0 
Y AmixAB) > Ama AJA máx (8). Por tanto, Amax(A) no es una norma. 
a) Sí, c(A) = [AINAT*] = 4 ce ya que ex es Se E nuevo. b) A“Tib=x 
7 ba 1 
q E NANIA Up Esto es 77 2 Gp 
[AI =2 yc = 1; [141] = V2 y c es infinita (¡singular!); 4] = Y2 yc = 1. 
Si Amáx = Amin = 1, entonces todos los A; = 1 y A = SIS”? = 1. Las únicas matrices 
con [41] = 47 * = 1 son matrices ortogonales, porque ATA tiene que ser 1. 


El residuo b — Ay = (10””, 0) es mucho menor que b — Az = (0.0013, 0.0016). Sin 
embargo, z está mucho más cerca de la solución que y. 








conduce a 


x? + ++ + x2 no es más pequeño que máx(x7) = (Ilxl].)? y no es más grande que 
(Jx1] + «++ + Jxn]?, que es (l|x11,)?. Ciertamente, 14 +x? < n máxíxf), de 
modo que lx] < Y/nllxllvo. Se escoge y = (sign x,, signxz,..., signx,) para obte- 
ner x-+y = lIxl|. Por la desigualdad de Schwarz, esto es cuando mucho llx HI] y]] = 
/n!llx. Se escoge x = (1,1,..., 1) para razones máximas ./7. 


9. -=36 30 
La inversa exacta de la matriz de Hilbert de 3 por 3 es A”'=|-36 192 —180]. 
305 180 180 


El llell = 1147 *b]] más grande es 1/A mim; el error más grande es 10 1%/A mío. 


A A 0 Ze 22 A Oo 
Intercambie > 2/1 o) > E E = U comp =| oy 
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1 0 2 2. 0 2 0, 2 2000 
L= 0: ¡4 10 1>]j0 -—=1 1| > 0 2 01 > 

Ue 0 0 Z2 30 e IR 
EN $, Or 0 59 1 0 0 
O 2 0|=U. Entonces PA=LUconP =|0 0 1l|y£=| O LO 
0% OL 1.050 A E | 


Conjunto de problemas 7.3, página 365 
ás Bras. 2 On 5 Mn. e _ 1 | 1| normalizado a un 
EA 0 -1p =4p 9 191 JO 1| vector unitano. 


3. ui JA = 0x1 + ax lA /A NES + cpx lA n/d —> 0x1 si todas las razones 


11/21] < 1. La razón máxima controla, cuando k es grande. A = , : tiene 


lA2] = jA1] y ninguna convergencia. 
zx 2(x — y)! 
% Hx=x->—(1x AAA = x — (x — y) = y. Entonces H(Hx) = Hy 
ES X= 1H d 
O 1 0 0 Ls 0 
is o »A 0 -3 —É£l| =U7 yentonces UTUAU=|-5 % %l. 
0 24 3 2 1 
5 5 25 25 


9, [cos 9 senó OR cosó —sen9| |1l cosgsen 9 
"lseng 0 sen9 cosg | |0 —sen? O | 
c(1 +5?) e 


Entonces RQ = | E LES? 


11. Suponga que (Oo -** Qx-1XRy-1 - > Ro) es la factorización OR de A* (lo cual cierta- 
mente es verdadero si k = 1). Por construcción, Az, = RO, de modo que R; = 
Arm107 =(0F.--- QOTAQo-*- 0:)Q%. Al multiplicar por la derecha por (Ry... ¡ - * 
Ro), la hipótesis proporciona R; - ++ Ro = QÍ- ++ QT4**!, Después de pasar las Qs al 
miembro izquierdo, este es el resultado requerido para A**!. 

13, A tiene valores característicos 4 y 2. Escriba un vector unitario en el renglón 1 de P: 
es ya sea 7 || | y PAP = B A 750 ¡|y Pap” = p a 

15. P;, usa 4n multiplicaciones (2 por cada elemento en los renglones i y /). Al factorizar 
cos 0, los elementos 1 y + tan O sólo requieren 2x2 multiplicaciones, lo cual lleva a 5 


n? para PR. 
Conjunto de problemas 7.4, página 372 


OZ "a 
2 
1 DU-L-U)=|i 0 1], valores característicos y = 0, +1/42; (D + L)”"! 
0 3 0 


¡sm 


, Valores característicos O, O, 1 / 2; Wépr = 4—2./2, reduciendo 
Amáx 23242 Y 0.2. 


l 

Ss 

l 
005 


op Am jr 
ja nj 
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3. Ax; = (2 2coskich)xg; Ixi = 3(sen2krch, sen 3kxrh +senkxh,...) = 
(cos kx h)x;. Para h = z Á tiene valores característicos 2 —2 cos sE 2- y2, 
pa =2, a =2 + 2. 
2 4 
00 El 
E a , 2 1 
S. J=DUL+U)=-]|0 O |; los tres círculos tienen radios r, = a 
2.2 0 : E 
s 5 
4 
fy = 5 Sus centros están en cero, de modo que todo |A¿| < 4/5 < 1. 
% 0 =bfa!|.. BEN E 
— l = = PP... . — 1 = 
E as E Se PO e 0 | ene +(5) "(_D+L*U 
O —b/a eN ; 2 
E ol A =0, bc/ad; A m4, es igual a ax: 


11. 


13. 


15 
17. 


. 


19, 


. Si Ax = Ax, entonces (1 — A)x = (1 — A)x. Los valores característicos reales de 


B=I-A tienen |l — Aj < 1, en el supuesto de que A esté entre O y 2. 


Siempre [¡4B!| < [141111B]|. Se escoge A = B para encontrar [1B?]] < |1B[1?. Luego se es- 
coge A = B? para encontrar [18%] < 11811111 < 118*[]. Continúe (o aplique inducción). 
Debido a que ||B!| > máx [A(B)/, no es sorprendente que con ||¡B|| < 1 se obtenga 
con lAlmnáx = 3 = (Almax para Jacobi)”. 


convergencia. 

Sobrerrelajamiento (SRS) sucesivo en MATLAB. 

Todas las sumas máximas de los renglones son jA| < 0.9 y |¡A] < 4. Los círculos alre- 
dedor de los elementos de la diagonal proporcionan cotas más estrechas. Primera A: el 
círculo ¡A — 0.2| < 0.7 contiene a los demás círculos ¡A — 0.3] < 0.5 y JA — 0.1] < 
0.6 y atodos los tres valores característicos. Segunda A: el círculo [1 — 2| < 2 contie- 
ne al círculo |A — 2| < 1, a todos los tres valores característicos 2 + V2, 2, y 2 — yY2. 
ri = b-0¡Ab = b-—(bTb/bTAD)YAD es ortogonal a ry = b: los residuos r = b 
— Ax son ortogonales en cada paso. Para demostrar que p, es ortogonal a Apo = Ab, 
p, se simplifica acP,: P, = |Abl?b — (PTADIAD y e = D"b/(bT ADyY?. Ciertamen- 
te (ADY"P, = 0, ya que A* = A. (Esta simplificación coloca a +, en p, = b— ayAb + 
(1Tb — 20 bTAd + 0? AbI2b/b*b. Para un buen análisis, consulte la obra Numeri- 
cal Linear Algebra de Trefethen y Bau). 


0 
A St E 
1 e con lAlmáx = 3. Gauss-Seidel tiene 57'T = h 


Jacobi tiene ST = | h E 


Dj La] 


Conjunto de problemas 8.1, página 381 


Es 
Sy 


5 


Te 


Los vértices están en (0, 6), (2, 2), (6, 0); consulte la figura 8.3. 

Las restricciones proporcionan 3(2x + 5y) + 2(—3x + 8y) < 9 — 10, o bien, 
31y < — 1. No es posible tener y > 0. 

x > 0, y > O, con restricciones adicionales de que x + y < O sólo admite el punto 
(O, 0). 

x (bonos al 53%) = z (bonos al 9%) = 20 000 y y (bonos al 6%) = 60 000. 








9. 
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El costo a minimizar es 1000x + 2000y + 3000z + 15004 + 3000v + 3700w. Las 
cantidades x, y, za Chicago y u, v, w a Nueva Inglaterra satisfacen x + u = 1 000 000; 
y +v=1000000; z + w = 1000000; x + y + z = 800000; u + v + w = 
2 200 000. 


Conjunto de problemas 8.2, página 391 


1. 


11. 


En el presente, xy = 4 y x5 = 2 están en la base, y el costo es cero. La variable de en- 
trada debe ser x3 para reducir el costo. La variable de salida debe ser xs, ya que 2/1 es 
menor que 4/1. Con x3 y x, en la base, las restricciones proporcionan xy = 2, xy = 2, 
y ahora el costo es x; + Xx — Xx3 = —2. 


Los “costos reducidos” son r = [1 1], de modo que el cambio no es bueno y el vér- 
tice es óptimo. 


EnP,r=([-5 3) asíenQ, r = [5 =3); R es óptimo porque r > 0. 


Para un problema de maximización, la prueba de detención se convierte en r < 0. Si 
fracasa, y el ¿-ésimo componente es el más grande, entonces esa columna de N entra 
en la base; la regla 8C para el vector que sale de la base es la misma. 


BE = Bl[:*-v:+*] =[---u---], ya que Bu = u. Por tanto, la matriz correcta es E. 
Si Ax = 0, entonces Px =x — ATY(AAT)Tl Ax =x. 


Conjunto de problemas 8.3 página 399 


1; 


3. 


11. 


13. 


Maximizar 4y; + 1ly,, con y; > 0, ya > 0, 2y, + ya < 1, 3y2 < 1; el original tiene 
xf =2,x7 = 3, el dual tiene y? = 2, yF = 1, costo = 5. 
El dual maximiza yb, con y > c. En consecuencia, x = b y y = c son factibles, y pro- 


porcionan el mismo valor cb para el costo en el original y en el dual; por 8F deben 
ser Óptimas. Si b, < O, entonces la óptima x cambia a (Webicos Day y* = 
(O, CO da Cs 

b=[0 1'”,yc=[-1 0. 

Debido a que cx =3 = yb, x y y por 8F son óptimas. 


¿x*=([1 OP yy*=[1 0], con y*b = 1 =cx*. Las segundas desigualdades tanto 


en Ax* > b como en y*A < c son estrictas, por lo que las segundas componentes de 
y* y x* son cero. 
ax =0,x =1,xf = 0,c'x = 3. b) Esel primer cuadrante con el tetrae- 
dro en el vértice de corte. Cc) Maximizar y,, sujeto a y; > 0, yí < 3, y, < 3, 
MERO SS: 

Ñ Za 0 oa 
Aquíc=([1 1 l]conA = E o 1) No hay restricción x > 0, por lo que el dual 


tiene la igualdad yA = c (o A?*y = cP). Así se obtiene 2y, = 1 y y, = 1 y y, = 2 y ningu- 
na solución factible. Así, el máximo del original debe ser 00: x, = "Nyx,=2N yx, =0 
proporcionan Costo = x, + x, + x3 = N (arbitrariamente grande). 


13; 


EZ, 


1 A y A E A! 0 O 1.0.0 —] 
Las columnas de JO 1 0 O —1 OtfofjO0 1 0 —-1! 
O O 1 0 oO —i A y AS E | 


Tome y = [1 —1]; entonces yA > 0, yb < 0. 
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Conjunto de problemas 8.4, página 406 


A; 
de 


11. 


13, 


15. 


El flujo maximal es 13, con el corte minimal que separa el nodo 6 de los otros nodos. 


Al incrementar la capacidad de los tubos del nodo 4 al nodo 6 o del nodo 4 al nodo 5 
se obtiene el incremento máximo en el flujo maximal. El flujo maximal crece de 8 a 9. 


. Asigne capacidades = 1 a todas las aristas. Entonces, el número máximo de rutas aje- 


nas desde s hasta í es igual al flujo máximo. El número mínimo de aristas cuya elimi- 
nación desconecta s de t es el corte mínimo. Así, flujo máx = corte mín. 


. Los renglones 1, 4 y 5 violan la condición de Hall; la submatriz de 3 por 3 que provie- 


ne de los renglones 1, 4 y 5 y de las columnas 1, 2, 5 tiene 3 + 3 > 5. 


. 2) La matriz tiene 21 unos, que no es posible cubrir por menos de n rectas porque ca- 


da una cubre exactamente dos unos. Se requieren n rectas; debe haber un apareamien- 
to completo. 


1 IS SP CE 
Or 0 07 Al 
b)11 0 O O 1. Losunos pueden cubrirse con cuatro rectas; cinco matrimo- 
A SO 
LEO LUIS IS 


nios no es posible. 

Si cada m + 1 se casa sólo con el hombre aceptable m, entonces no hay nadie que se 
case con el $1 (aun cuando todos sean aceptables para el +1). 

Con el algoritmo 1 se obtiene 1-3, 3-2, 2-5, 2-4, 4-6, y con el algoritmo 2, 2-5, 4-6, 2- 
4, 3-2, 1-3. Estos son los árboles generadores más cortos de la misma longitud. 

a) Los renglones 1, 3 y 5 sólo tienen unos en las columnas 2 y 4. b) Las columnas 
1,3 y 5 (en los renglones 2 y 4). Cc) La submatriz cero desde los renglones 1, 3 y 5 
y las columnas 1,3 y 5. d) Los renglones 2 y 4 y las columnas 2 y 4 cubren todos 
los unos. 


Conjunto de problemas 8.5, página 413 


1. 


—10x, +70(1—x1) = 10x, —10(1 —x1), O bien, x, = %,x2 = 3; —10y, +10(1 — 
y1) = 70y1 — 10(1 — y1), o bien, y, = 1, y, = $; pago medio yAx = 6, 


. Si X escoge la columna j, Y elegirá su elemento más pequeño a;; (en el renglón ¿). 


X no se moverá, porque este es el mayor elemento en ese renglón. En el problema 
2, 4127 = 2 era un equilibrio de este tipo. Si se intercambian el 2 y el 4 debajo del a», 
ningún elemento tiene esta propiedad, por lo que se requieren estrategias mezcladas. 


. La mejor estrategia para X combina las dos rectas para obtener una recta horizontal, 


garantizando esta altura de 7/ 3. La combinación es (3 y +2(1 — y) + 3 y RS (1 
y) = 7/3, por lo que X escoge las columnas con frecuencias 2, O, 1. 


. Para las columnas, se quiere 1x4 + (1 — x1)b = xc +(1 — xd = u, de modo que 


xtla =b=c+d) = db. Para los renglones, ya + (1 — y )e = y¡b + 
(1 — yYd = yv intercambia b y c. Compare u con u: 
(a — bXd —b) ad bc ; A 
= =b + dy == —TáÁ yo —_ —_———— = lo mismo después de 
O ) as=b 0d A abad S 
boc=0w. 





11. 


13. 
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. El máximo interior es el mayor de y, y y2; x se concentra en ése. Sujeto a y, + y, = 1, 


el mínimo de la y más grande es 3. Observe A = 1. 


, y, + z PS > para todas las estrategias de Y; 


1 


1] y y*Ax = 5] + 52 


"y yaxt = 
-1 


4x* =p] 


ya =l5 3 
1 


2; en medio está y*Ax* = 3. 


— X3 — X4, Que no pueden exceder 


Valor 0 Guego justo). X escoge 2 o 3, y escoge impar o par: x* = y* = ( 


dl 


Na 


1 
od 


Conjunto de problemas A, página 420 


1. a) Mayor dim (S N T) = 7 cuando S CT. b) Menor dim (SN T) = 2. Cc) Menor 
dim (S + T) = 8 cuando S € T. d) Mayor dim (S + T) = 13 (todo R*”). 
a 42 413 41 an a 0 0 
3. V + W y VNW contienen A y o) a a 0 : 
O az 433 434 0 0 a 4 
0 0 443 044 0 0 0 Zas 


e] 


11, 


dim(V + W) = 13 y dim (V N W) = 7; se suma para obtener 20 = dim V + dim W. 


. Las rectas que pasan por (1, 1, 1) y (1, 1, 2) tienen V N W = (0). 
. Una base para V + W es v,, v,, w,; dim (V N W) = 1 con base (0, 1, —1, 0). 
. La intersección de los espacios columna es la recta que pasa por y = (6, 3, 6): 


1 


ECO 1 31.0 2 O ES E 1 
y= 13 0 A =|l0 1 3 coincide con [A Blx=|13 0 O 1 2 = (. 
2 A 02 DADO 2 


La dimensión de los espacios columna es 2. La suma y la intersección de ellos son 
E E 


IRA. EIT_ZJi-1 1-1 
nor=|7 SU an: 
Lo=1 10 1 


13. Ap = Up 907180D+18ADP8D+(1819Ajp). 


Conjunto de problemas B, página 427 


1. 


3 


S 


0 1 0 
J = E o (A es diagonalizable); J = F 0 ] (vectores característicos (1, O, 
O 0.0 
0) y (21,0). 
lA a 
e =l0 1 0Ol| =/ + B: porque B? = 0. También e! =] +J+. 
0-20: 0 
y A 0 0 
J=1l0 4 0l|6fvalores característicos distintos); J = | ñ (B tiene A = 0, 
0. 06 


O, pero rango 1). 








Factorizaciones matriciales 


E 


10. 


A=LU= ( L triangular sacd ( U triangular superior ) 


unos en la diagonal pivotes en la diagonal 
Requerimientos: Ningún intercambio de renglones mientras la eliminación gaussia- 
na reduce A a U. 


AS EDO ( L triangular inferior ) ( matriz de pivotes ) ( U triangular o 


unos en la diagonal D es diagonal unos en la diagonal 
Requerimientos: Ningún intercambio de renglones. Los pivotes de D se dividen pa- 
ra dejar unos en U. Si A es simétrica, entonces U es L' y A = LDL”. 


PA = LU (matriz permutación para evitar ceros en las posiciones pivote). 
Requerimientos: A es invertible: Así, P, L, U son invertibles. P realiza el intercam- 
bio de renglones de antemano. Alternativa: A = L,P,U,. 


EA =R (E invertible de m por micualquier A) = rrefí4). 

Requerimientos: ¡Ninguno! La forma escalonada reducida R tiene r renglones pivo- 
te y columnas pivote. El único elemento diferente de cero en una columna es el pivote 
unitario. Los m — r últimos renglones de £ son una base del espacio nulo izquierdo de 
A, y así las r primeras columnas de E”? son una base para el espacio columna de A. 


A =CC* = (Matriz triangular inferior C)(la traspuesta es triangular superior). 
Requerimientos: A es simétrica y positiva definida (todos los n pivotes en D son po- 
sitivos). La factorización de Cholesky tiene C = EN D. 


A = OR = (columnas ortonormales en O)Xtriangular superior R). 
Requerimientos: A tiene columnas independientes. Estas son ortogonalizadas en Q 
mediante el proceso de Gram-Schmidt. Si A es cuadrada, entonces O”! = Q”. 


A = SAST? = (vectores característicos en SXvalores característicos en A)Xvectores 
característicos izquierdos en S” ?). 
Requerimientos: A debe tener 1 vectores característicos linealmente independientes. 


A = QAO” = (matriz ortogonal OXmatriz Á de valores característicos realesK(O” es 
O 


Requerimientos: A es simétrica. Este es el teorema espectral. 


A = MJM"? = (vectores característicos generalizados en Mi(bloques de Jordan en 
DM. 

Requerimientos: A es cualquier matriz cuadrada. La forma de Jordan J tiene un blo- 
que para cada vector característico de A independiente. Cada bloque tiene un valor ca- 
racterístico. 


A=UuxyT = (Y ortogonal Matriz 2, de m X n V ortogonal 
es de m X m 0, ..-., 0, en la diagonal es den X n 


a 


a md SP II DA IN TND DIU Al a MFD. NDA ET a 


A e TT A 


1L 


12. 


3. 


14. 


15. 


A A E A A Vo AT SAA AI. IAEA 


A 
E OS 000 “Fsctorizaciones matriciales 475 
e ¿423803 
Rele FRA ti E de ERADIOE AI IAP ingular (DVS) tiene los 
vectores característicos de AAT en U y los de ATA en V; 0, = ./2,(4T4) = 


Y Aca?) 
AED VETE E) .. eo EAN E) ( ortogonal ) 


de n por n de n por m de m por m 


Requerimientos: Ninguno. La seudoinversa tiene ATA = proyección sobre el espa- 
cio renglón de A y AA” = proyección sobre el espacio columna. La solución más cor- 
ta por mínimos cuadrados de Ax = bes % = A*b, Esto resuelve ATAR = ATb, 


A = QH = (matriz ortogonal O) matriz H positiva definida simétrica). 
Requerimientos: A es invertible. Esta descomposición polar tiene H? = ATA. El fac- 
tor H es semidefinido si A es singular. La descomposición polar inversa A = KQ tie- 
ne K? = AA*, Con base en la DVS, ambas tienen O = UV”. 


A =UAU”? = (U unitaria)(matriz valor característico AXU7!? = YE = JB), 
Requerimientos: A es normal: AYA = AAF, Sus vectores característicos ortonorma- 
les (y tal vez complejos) son las columnas de U. Los As son complejos a menos que 
A =AP?,. 


A = UTU”?! = (U unitariaXT triangular con As en la diagonal(U7* = UB), 
Requerimientos: Triangularización de Schur de cualquier A cuadrada. Existe una 
matriz U con columnas ortonormales que hace triangular a U”!'AU, 


0 Y Di |Fn/ Permutación | _ 
Pa = | OA A | re | opa | un paso de la TFR. 


Requerimientos: F, = matriz de Fourier con elementos wW donde w” = 1, w = 
e2ri/a Así, FF, = ni Dtiene 1, w, we, . en su diagonal. Para n = 24, la transfor- 
mada de Fourier rápida (TFR) tiene 5 Lal multiplicaciones de las £ etapas de las Ds. 








Base de Y Vectores independientes v;, . 


. , U¿ Cuya com- 
binación lineal proporciona todo v en Y, ¡Un espacio vec- 
torial tiene muchas bases! 


Base normal de R” Columnas de la matriz identidad de n 
por n (se escribe i, j, k, en R?). 


Cociente de Rayleigh q(x) = x"Ax/x"x Para cada A = 
AS Amía E 900 E Amáx. Estos extremos se alcanzan en los 
vectores característicos x para AmmliA) Y Amáx(A). 


Cofactor C¿ Quitar el renglón ¡ y la columna 7; multi- 
plicar el determinante por (1) +4, 


Columnas pivote de A Columnas que contienen pivotes 
después de la reducción de renglones; no son combinaciones 
de columnas anteriores. Las columnas pivote son una base 
del espacio columna. 


Complemento de Schur $ =D — CA7*'B Aparece en la 
eliminación por bloques de | ña Es | 
Compare Ly = 2 con los números de Fibonacci. 


Combinación lineal cv + dw o Ec;v, Suma vectorial y 
multiplicación por un escalar. 


Conjugado complejo Z =a-—ib para cualquier número 
complejo z = a + ib. Así, 2 = |z/?. 

Conjunto 91, ... , Y, generador de Y Todo vector en V 
es una combinación de v;,..., Un» 

Cuatro subespacios fundamentales de A C(A), N(A), 
CAB), NAT), 

Descomposición del valor singular (SVD) A = UXV* = 
(U ortogonal) multiplicada por (diagonal 2) multiplicada 
por (V* ortogonal V") Las primeras r columnas de U y Y 
son bases ortonormales de C(4) y C(4*), con Av, = 04; y 


valor singular o; > 0. Las últimas columnas de U y V son ba- 
ses ortonormales de los espacios nulos de A? y A. 


Descomposición polar A = QH O ortogonal, H positiva 
(semi) definida. 


Desigualdad de Schwarz |v - w| < Jlvul| [¡w]. Así, 
luTawl? < (vPAvw FT Aw) si A = CTC. 

Desigualdad del triángulo lu + v|| < Jlul| + llv]] Para 
normas matriciales, [4 + B| < [All + 181. 


Desplazamiento cíclico S Permutación con $2, = 1, $37 = 
1,..., por último's¡, = 1. Sus valores característicos son 


cionario 


n raíces e27ik/n de 1; los vectores característicos son colum- 


nas de la matriz de Fourier F. 


Determinante ¡4]| = det(4) Definido por det J = 1, con 
inversión de signo para intercambio de renglones, y linea- 
lidad en cada renglón. Así, [4| = O cuando A es singular. 
También, |4B] = |4]1B], 47 '] = 1/14] y 14*] = |4]. La gran 
fórmula para det (A) tiene una sumatoria de n! términos, y 
en la fórmula de cofactores se utilizan determinantes de ta- 
maño n — 1 y el volumen de la caja = [det (4)1. 


Diagonalización A = STIASA = Matriz de valores ca- 
racterísticos y S = matriz de vectores característicos. A de- 
be tener n vectores característicos independientes para que 
S sea invertible. Todas las 4% = SAFS”7!, 


Dimensión del espacio vectorial dim(V) = número de 
vectores que hay en cualquier base de Y. 


Ecuación característica det (A — AD) = 0. Las n raíces 
son los valores característicos de A. 


Ecuación normal ATA% = A*% proporciona la solu- 
ción por mínimos cuadrados de Ax = 0 si el rango total de 
A es n. La ecuación establece que (columnas de A) : 
(b — AX) =0. 


Eigshow Valores característicos y valores singulares grá- 
ficos de 2 por 2. (MATLAB o Java). 


Eliminación: Sucesión de operaciones en los renglones 
que reduce Á a una U triangular superior o a la forma re- 
ducida R = rrefíA). Así, A = LU con multiplicadores £,, en 
L, o FA = LU con intercambio de renglones en P, o EA = 
R, con una £ invertible. 


Elipse (o elipsoide) x"Ax = 1 A debe ser positiva defini- 
da; los ejes de la elipse son vectores característicos de A, con 
longitudes 1/ 4A. (Para llxll = 1, los vectores y = Ax 
están en la elipse (147 * y? = y(AAT)7!y = 1 mostra- 
da por eigshow; las longitudes de los ejes son a). 


Espacio columna C(4) Espacio de todas las combina- 
ciones de las columnas de A. 


Espacio nulo N(4) Soluciones de Ax = 0. Dimensión n — 
r = ($k columnas) — rango. 

Espacio nulo izquierdo N(4*) Espacio nulo de A* = “es- 
pacio nulo izquierdo” de A porque yla = 0%. 


Espacio renglón C(4*) Todas las combinaciones de los 
renglones de 4. Por convencionalismo, vectores columna. 





Espacio vectorial Y Conjunto de vectores tales que todas 
las combinaciones cu + dw permanecen en V. En la sección 
2.1 se proporcionan ocho reglas necesarias para cu + dw. 


Espectro de A Conjunto de valores característicos 
(ASES ..., An]. 


Exponencial La derivada de £% =] + A4t+(A1?/2! 
+... es Ae*; eA' u(0) resuelve u' = Au. 


Factorización A = LU Si con la eliminación se llega de A 
a U sin intercambio de renglones, entonces la triangular in- 
ferior L con multiplicadores £,, (y £,¡ = 1) regresa de UVa A. 


Factorización de Cholesky A=CCT= (L VDNL 3D da 
para A positiva definida. 


Factorizaciones simétricas A = LDL? yA =QAQ* El 
número de pivotes positivos en D y valores característicos 
positivos en Á es el mismo. 


Forma de Jordan J = MIAM Si A tiene s vectores ca- 
racterísticos independientes, su matriz “generalizada” M de 
vectores característicos proporciona J = diag(J¡,.... J,). El 
bloque J, es Ayl, + N, donde N, tiene unos en la diagonal 
1. Cada bloque tiene un valor característico A, y un vector 
característico (1, 0,..., 0). 


Forma escalonada reducida por renglones R = rrefíA) 
Pivotes = 1; ceros arriba y abajo de los pivotes; r renglones 
diferentes de cero de R constituyen una base para el espacio 
renglón de A. 


Gráfica de G— Conjunto de » nodos unidos por parejas 
mediante m aristas. Una gráfica completa contiene todas 
las n(n — 1)/2 aristas entre los nodos. Un árbol sólo contie- 
ne n — 1 aristas y no contiene circuitos cerrados. 


Gran fórmula para determinantes de n porn  det(4) 
es una sumatoria de nm! términos, uno para cada per- 
mutación P de las columnas. Ese término es el producto 
Ala ***Anw en la diagonal de la matriz reordenada, multi- 


plicado por det(P) = 31. 

Inversa derecha A* Si el rango total del renglón de A es 
m, entonces A? = ATAABD”7? tiene AA? = L,. 

Inversa izquierda A* Si el rango columna completo de 
A es n, entonces A* = (ATA) 14? tiene AFA = LI, 

La multiplicación por bloques de AB es permitida si las 


formas de los bloques lo permiten (las columnas de A y los 
renglones de B deben estar en bloques que correspondan). 


Ley asociativa (AB)C = A(BC) Los paréntesis pueden 
quitarse para dejar ABC. 


Ley distributiva A + (B + C)= AB +AC Se suma y 
luego se multiplica, o se multiplica y luego se suma. 


Leyes de Kirchhoff Ley de la corriente: La corriente ne- 
ta (en salida menos) es cero en cada nodo. Ley del voltaje: 
La suma de las diferencias de potencial (caídas de tensión) 
es cero en cualquier circuito cerrado. 


Longitud |x| Raíz cuadrada de x*x (teorema de Pitágo- 
ras en a dimensiones). 
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Matrices de conmutación AB = BA En caso de ser dia- 
gonalizables, comparten n vectores característicos. 


Matrices semejantes A y B_ B = M"*AM tiene los mis- 
mos valores característicos que Á. 


Matriz A positiva definida Matriz simétrica con valores 
característicos positivos y pivotes positivos. Definición: 
x"Ax > 0 a menos que x = 0. 


Matriz A semidefinida (Positiva) semidefinida significa 
simétrica con xAx > 0 para todos los vectores x. Por tanto, 
todos los valores característicos A > 0; no hay pivotes nega- 
tivos. 


Matriz A = uv? + 0 con rango 1 Los espacios columna 
y renglón = rectas cu y cv. 


Matriz acompañante En el renglón n se escribe c;,,..., 
c, y en la diagonal se escriben n — 1 unos. Entonces det 
(AA) = H(c1 + 074 +0342 +---) 


Matriz aleatoria rand(7) o randn(n) MATLAB crea una 
matriz con elementos aleatorios distribuido uniformemente 
en [0 1] para rand, y con una distribución normal estándar 
para randn. 


Matriz aumentada [4 b] Ax = bes resoluble cuando 
b está en el espacio columna de A; así, el rango de [4 b] 
es el misrno que el de A. La eliminación en [4 b] preser- 
va correctas las ecuaciones. 


Matriz circulante C— Diagonales constantes se envuelven 
como en un desplazamiento cíclico. Toda matriz circulante 
es col + 018 +: +cp-18%7?, Cx = convolución c « 
x. Los vectores característicos están en F. 


Matriz de adyacencia de una gráfica Matriz cuadrada 
con ay; = 1 cuando hay un lado que va del nodo i al nodo 
j; en caso contrario, ay = 0. A = A* para una gráfica no 
dirigida. 

Matriz de covarianza % Cuando las variables aleatorias 
x, satisfacen media = valor medio = 0, sus covarianzas 2; 
son los promedios de x;x,, Con las medias x;, la matriz 2 = 
media de (x — Mx — xXx) es positiva (semiddefinida: es 
una matriz diagonal si las x, son independientes. 


Matriz de eliminación = Matriz elemental E,; La ma- 
triz identidad con un —£;, en el elemento ¿, ¡ (¿ % 7). Así, 
E,¡ resta £¿, veces el renglón ¡ de A del renglón 1. 


Matriz de Hilbert hilb(x=) Elementos H;¡=1/H(¿+j-1)= 
E xi"1xiTldx. Positiva definida pero Amp, extremada- 
mente pequeño y número de condición grande. 


Matriz de incidencia de una gráfica dirigida La matriz 
de incidencia de m por n aristas-nodos tiene un renglón por 
cada arista (del nodo i al nodo 7), con elementos —1 y 1 en 
las columnas i y ]. 

Matriz de Pascal P¿ = pascal(1) La matriz simétrica con 
elementos binomiales (*7? ae Todos los Pg = PL Py 
contienen el triángulo de Pascal con det = 1 (consulte el ín- 
dice para encontrar más propiedades). 
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Matriz de permutación P— Hay n! órdenes de 1, ...,A; 
las n! Ps tienen los renglones de f en el mismo orden. PA 
coloca las columnas de A en el mismo orden P es un produc- 
to de intercambios de renglones P,;, P es par o impar (det 
P = 10 —1) con base en el número de intercambios. 
Matriz de rigidez K Cuando x proporciona los movi- 
mientos de los nodos en una estructura discreta, Kx propor- 
ciona las fuerzas internas. A menudo K = A*CA, donde C 
contiene constantes de resorte de la ley de Hooke y Ax = 
alargamiento (esfuerzos) de los movimientos x. 


boe g —senó 


fl 


Matriz de rotación R 


tar el 
Send eS o hace rotar e 


plano un ángulo 6, y R7* = R* lo hace girar un ángulo —6. 
Matriz ortogonal, valores característicos e? y e”'%, vectores 
característicos (1, +1). 


Matriz diagonal Dd, =0sii 7 j. Diagonal por blo- 
ques: ceros fuera de los bloques cuadrados D. 


Matriz diagonalizable A Debe tener n vectores carac- 
terísticos independientes (en las columnas de S; en forma 
automática con n valores característicos diferentes). Así, 
STIAS = A = matriz de valores característicos. 


Matriz en bloque Una matriz puede separarse en matrices 
por bloques, cortando entre renglones y/o entre columnas. 


Matriz escalonada U El primer elemento diferente de 
cero (el pivote) en cada renglón aparece después del pri- 
mer pivote en el renglón previo. Todos los renglones cero 
vienen al último. 


Matriz F de Fourier Los elementos Fj¿ = e2riJkin 


proporcionan columnas ortogonales FF = n1. Por tanto, 
y = Fc es la transformada discreta (inversa) de Fourier 


y¡= AR cpe2ridk! n 


Matriz H de Henkel Constante alo largo de cada antidia- 
gonal; h¡¡ depende de i +. 


Matriz H de Hessenberg Matriz triangular con una dia- 
gonal adyacente adicional diferente de cero. 


Matriz hermitiana AH = Z* = A Análogo complejo 
de una matriz simétrica 4; = ajj. 


Matriz hipercubo P? En el renglón n + 1 se cuentan 
las esquinas, las aristas, las caras, etc., de un cubo en R”. 


Matriz identidad / (o I,) Elementos diagonales = 1, ele- 
mentos fuera de la diagonal = O. 


Matriz indefinida Matriz simétrica con valores caracterís- 
ticos de ambos signos (+ y —). 


Matriz inversa A“? Matriz cuadrada con 47 *% = [ y 
AA”? = [, No tiene inversa si det A = O y rango (4) < n; 
además, Ax = 0 para un vector x diferente de cero. Las in- 
versas de AB y A* son B7"147! y (47D, La fórmula de co- 
factores es (AD); = CN det A. 


Matriz M de cambio de base Los vectores v, de la base an- 
terior son combinaciones Xm,w, de los vectores de la base 
nueva. Las coordenadas de C1U1 + *** E CaUa = dy +occ+ 


Ann están relacionadas según d = Mc. (Para n = 2, se hace 
YU] = M]1W] + M21W2, V2 = M]20] + M2202.) 


Matriz M de Markov Todos los 7; > O y la suma de ca- 
da columna es 1. El valor característico máximo es A = 1. 
Si my > 0, las columnas de M* tienden al vector caracterís- 
tico de estado estacionario Ms = s > 0. 


Matriz normal N NN = NN, que conduce a vectores 
característicos (complejos) ortonormales. 


Matriz N del espacio nulo Las columnas de N son las 
n — r soluciones especiales de As = O. 


Matriz nilpotente N Alguna potencia de N es la matriz 
cero, N* = 0, El único valor característico es A = O (repeti- 
do n veces). Ejemplos: matrices triangulares con diagonal 
cero. 


Matriz ortogonal Q Matriz ortogonal con columnas orto- 
normales, de modo que O*Q = Z implica Q* = Q”?. Preser- 
va ángulos y longitud. |/Qxl| = [lxI| y (00) *(Qy) =x*y 
Todos los |A| = 1, con vectores característicos ortogonales. 
Ejemplos: Rotación, reflexión, permutación. 


Matriz proyección P sobre el subespacio S La proyec- 
ción p = Pb es el punto más próximo a b en S; el error e = 
b — Pb es perpendicular a S. P? = P = P', los valores ca- 
racterísticos son 1 o 0; los vectores característicos están en 
S o en S”. Si las columnas de A = base de S, entonces P = 
A(ATAy lar, 

Matriz reflexión Q = I-2uu* El vector unitario u se re- 
fleja en Qu = —u. Todos los vectores x en el plano u*x = 0 
permanecen sin cambio porque Qx = x. La “matriz del in- 
quilino” cumple OQ? = Q7* = 0. 

Matriz simétrica A La traspuesta es A? = A, y a = aj. 
A7* también es simétrica. Todas las matrices de la forma 
RTR, LDL" y QAO? son simétricas. Las matrices simétricas 
tienen valores característicos reales en Á y vectores carac- 
terísticos ortonormales en O. 


Matriz simétrica sesgada K La traspuesta es —K, ya que 
K¡¡ = —"Kj¡ Los valores característicos son puramente ima- 
ginarios, los vectores característicos son ortogonales; e*! es 
una matriz ortogonal. 


Matriz singular A Matriz cuadrada que no tiene inversa: 
det (4) = 0. 


Matriz T de Toeplitz Matriz con diagonal constante, de 
modo que 1;; Sólo depende de j — £. Las matrices de Toeplitz 
representan filtros lineales invariantes en el tiempo en el 
procesamiento de señales. 


Matriz traspuesta A? Los elementos AT = Aj¡. A? es 


de n por m; ATA es cuadrada, simétrica y Positiva semidefi- 
nida. Las traspuestas de AB y A7* son BYA? y (AP)! 
Matriz tridiagonal T  £,=0si [i — | > |. 77? tiene ran- 
go 1 arriba y abajo de la diagonal. 

Matriz unitaria yH = y? 
les (análogo complejo de O). 


= [171 Columnas ortonorma- 








A 


A AAKXÉ AX PP 


A o 


e as) FU 


Matriz V de Vandermonde Ve = hb proporciona el polino- 
mio p(x) =c9 +++ +ep 7) con p(x) = b, en n pun- 
tos. V¿ = (x)7*, y det V = producto de (x¿ — x;) para k > i. 


Método de Gauss-Jordan A se invierte con operaciones 
en los renglones sobre [A /] para llegar a [7 47*]. 


Método simplex de programación lineal El vector x” de 
costo mínimo se encuentra desplazándose de un vértice ha- 
cia el vértice de menor costo a lo largo de las aristas del con- 
junto posible (donde se satisfacen las restricciones Ax = b 
y x > 0). ¡El costo mínimo se encuentra en un vértice! 


Método iterativo Secuencia de pasos que se siguen para 
aproximarse a la solución deseada. 


Método del gradiente conjugado Sucesión de pasos para 
resolver una positiva definida Ax = b minimizando 
5 x* Ax — x*psobre subespacios crecientes de Krylov. 


Multiplicación Ax = x¡(columna 1) + : ++ + x,(columna 
n) = combinación de columnas. 


Multiplicación de matrices AB El elemento i, j de AB 
es (renglón i de A) * (columna / de B) = Xa;b;; Por colum- 
nas: columna ¡ de AB = A multiplicada por la columna j de 
B. Por renglones: el renglón ¿ de A multiplica a B. Columnas 
por renglones: AB = suma de (columna Xrenglón k). Todas 
estas definiciones equivalentes provienen de la regla de que 
AB multiplicada por x es igual a A multiplicada por Bx. 


Multiplicador £; El renglón pivote j se multiplica por £; 
y se resta del renglón i para eliminar el elemento i, ]: £,; = 
(elemento a eliminar)/ (¡-ésimo pivote). 


Multiplicidades AM y GM La multiplicidad algebraica 
AM de un valor característico A es el número de veces que 
A aparece como raíz de det (4 — 17) = 0. La multiplicidad 
geométrica GM es el número de vectores independientes (= 
dimensión del espacio característico para 4.). 


Norma |[A || de una matriz La “norma £?” es la razón má- 
xima |[Axl!/ lle = Omax- Así, | Axl| = (14 [ lil, [ABI = (¡Al 
Bl, y [A + Bl] = [AH + 11B[[. Norma de Frobenius Las 
normas [4114 = Y) añ £* y £% son las máximas su- 
mas de columnas y renglones de Ja,;!. 

Número de condición cond(4) = k(4) =]]4 1111474] = 
OGmáx/S mía, En Áx = b, el cambio relativo [J$x || / lx! es 
menos que cond(4) multiplicado por el cambio relativo 


SD / DJ. Los números de condición miden la sensibili- 
dad de la salida al cambio en la entrada. 


Números de Fibonacci 0,1,1,2,3,5,..., que satisfacen 
Fa= Fai + Fa = (ADA 1 — 42). La razón 


de crecimiento Aj = ( Il + /5)]2 es el valor caracterís- 


tico máximo de la matriz de Fibonacci | ' al 


Números de Lucas La = 2,1,3,4,... , satisfacen 
Ln = Ent En2= A ¡+45 con valores característicos 


AA = (3 1512 de la matriz de Fibonacci la el 
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Ondas w;(t) o vectores w,, Reescalan y desplazan el eje 
del tiempo para crear wy(t) = won(21 — k). Los vectores 
provenientes de way = (1, 1, —1, — 1) deben ser (1, —1, 0, 
Oy (0,0. 1:=1) 


Ortogonalización de Gram-Schmidt A =OR Colum- 
nas independientes en A, columnas ortonormales en OQ. Ca- 
da columna q, de Q es una combinación de las j primeras 
columnas de Á (y al revés, de modo que RK es triangular su- 
perior). La simbología es diag (R) > O. 


Pivote d El primer elemento diferente de cero cuando un 
renglón se utiliza en eliminación. 


Plano (o hiperplano) en R” Las soluciones de ax = 0 
proporcionan el plano (dimensión n — 1) perpendicular a 
a 0. 


Pivoteo parcial Durante la eliminación, el j-ésimo pivote 
se elige como el elemento más grande disponible (en valor 
absoluto) en la columna /. Así, todos los multiplicadores sa- 
tisfacen [£,;! 2, 1. El error por redondeo está controlado (de- 
pendiendo del número de condición de A). 


Polinomio mínimo de A El polinomio de menor grado 
con m(A) = matriz cero. Las raíces de m son valores carac- 
terísticos, y mí(A) divide a det (A — AL. 


Producto cruz u X ven R? Vector perpendicular a u y 
v, de longitud [lu ||[]v]]| senó| <= área del paralelogramo, 
calculada como el “determinante” de [Y J k; uy us Us; v; 
vz U3l. 

Producto de Kronecker (producto tensoriabA 9 B  Blo- 
ques a¿B, valores característicos 4 p(4)9(B). 

Producto punto xy = x,y, + *** + xy, El producto 
punto complejo es yTy. El producto punto de vectores 
perpendiculares es cero. (AB), = (renglón i de A)'(colum- 
na / de B). 

Producto externo uv* 
== matriz de rango 1. 


Columna multiplicada por renglón 


Proyección p = ala" b/a"a) sobre la recta que pasa por a 
El rango de P = aa'/aa es 1. 


Punto silla de f(x 1, ..., Xx) Punto en que las primeras de- 
rivadas de f son cero y la segunda matriz de derivadas 
(074/9x,0x, = matriz hessiana) es indefinida. 


Radio espectral = |Amaxl. 


Rango A(r) Es igual al número de pivotes = dimensión 
del espacio columna = dimensión del espacio renglón. 


Rango total de la columna r = n Columnas indepen- 
dientes, N(4) = (0), sin variables libres. 


Rango total del rengiónr =m  Renglones independientes, 
por lo menos una solución de 4x = b; el espacio columna 
es todo R”. Rango total significa rango total de la cohum- 
na o rango total del renglón. 


Red Gráfica dirigida que tiene C,, .. 
ciadas con las [A || aristas. 


. y Cy, COnstantes aso- 


Regla de Cramer para Ax =b  B,tiene b reemplazando 
la columna ¡de A y x; = |8B;|/4]. 


— e mr ¡__—_—_— A A AAA 


480 Glosario 


Representación por columna de Ax =b El vector b se 
convierte en una combinación de las columnas de A. El 
sistema sólo es resoluble cuando b está en el espacio 
columna C(4). 


Representación por renglón de Ax =b_ Cada ecuación 
proporciona un plano en R”; los planos se cortan en x. 


Seudoinversa A* (inversa de Moore-Penrose). La ma- 
triz n por m que “invierte” a A del espacio columna al es- 
pacio renglón, con N(A?) = N(ABD). AFA y AA* son las 
matrices proyección sobre el espacio renglón y el espacio 
columna. Rango (A*) = rango (4). 


Sistema resohible Ax = bh El miembro derecho bh está en 
el espacio columna de A. 


Solución completa x = x, + x, de Ax = 6 (x, particular) 
+ (x, en el espacio nulo). 


Solución particular x, Cualquier solución de Ax = b; a 
menudo x, tiene variables libres = O. 


Solución por mínimos cuadrados Xx El vector x que mi- 
nimiza el error [e]? resuelve ATAZ = ATb. Así, e = b— 
AX es ortogonal a todas las columnas de A. 


Soluciones especiales de As = 0. Una variable libre es 
s; = 1, las demás variables libres = 0. 


Subespacio de Krylov K,(A,b) Subespacio generado por 
b, Ab, ..., 4/7 'b. Métodos numéricos aproximan 4/”*b por 
x, con residuos b — Ax; en este subespacio. Una buena ba- 
se de K; requiere sólo multiplicación por A en cada paso. 


Subespacios ortogonales Todo uv en V es ortogonal a to- 
do w en W. 


Subespacio S de V' Cualquier espacio vectorial dentro de 
V, incluyendo V y Z = [vector cero). 


Suma V + W de subespacios Espacio de todos (los vu 
en V) + (los wen W). Suma directa: dim(V + W) = dim 
Y + dim W, cuando V y W sólo comparten el vector cero. 


Sustitución hacia atrás Los sistemas triangulares supe- 
riores se resuelven en orden inverso, de x, 2 xy. 


Suma vectorial v+w=(0,+W+... +0, +4) = 
diagonal del paralelogramo. 


Teorema de Cayley-Hamilton p(A) = det (4 — AJ) tiene 
p(4) = matriz cero. 


Teorema fundamental El espacio nulo N(A) y el espacio 
renglón C(4*) son complementos ortogonales (subespacios 
perpendiculares de R” con dimensiones r y n — r) de Ax = 


O. Aplicado a A*, el espacio columna C(A) es el comple- 
mento ortogonal de N(43). 


Teorema espectral A = QAQ* A simétrica real tiene A, 
real y q, ortonormal, con Aq; = A,q,; En mecánica, q; pro- 
porciona los ejes principales. 


Transformada de Fourier rápida (TFR) Factorización 
de la matriz de Fourier F', en matrices S, £ = log, n multi- 
plicadas por una permutación. Cada S, sólo requiere n/2 
multiplicaciones, de modo que F,x y F,7*c pueden calcu- 


larse con n£/2 multiplicaciones. Es revolucionaria. 


Transformación afín T(v) = Av + v¿ = transformación 
lineal más desplazamiento. 


Transformación lineal Y Cada vector uv en el espacio de 
entrada se transforma en 7(u) en el espacio de salida, y la li- 
nealidad requiere Tícv + dw) = cT(v) + dT(w). Ejemplos: 
multiplicación matricial Av, diferenciación en el espacio de 
funciones. 


Traza de A Suma de los elementos en la diagonal = su- 
ma de los valores característicos de A. Tr AB = Tr BA. 


Una gráfica dirigida tiene una flecha especificada en cada 
arista. 


Vi, » >» » y Y, linealmente dependientes Una combinación 
diferente de todos los c; = O proporciona Ec¿u;= 0. 


Valor característico A y vector característico x AÁx = 
Ax con x 7% 0, de modo que det(4 — Af) = 0. 


Variable libre x; La columna ¿ carece de pivote en la eli- 
minación. Es posible asignar cualesquiera valores a las n — 
r variables libres, y luego Ax = hb determina las r variables 
pivote (¡en caso de ser resoluble!) 


Vector veu R” Sucesión de n números reales v = (uy, 
e... U,) = punto en R”. 


Vectores independientes %;,, ..., 0. Ninguna combina- 
ción C/U, + *** + C¿U¿ = vector cero a menos que todas las 
c; = O. Si las us son las columnas de A, la única solución 
de Ax=0esx=0. 


Vectores ortonormales 1, ... ,G, Los productos punto 
son gq; =0,sii%jy qq, = 1. La matriz Q con es- 
tas columnas ortonormales cumple 0*O = 7. Sim = n, en- 


tonces Q* = Q”1 y q;,...., q, es una base ortonormal de 
R”; toda y = NiuTa aj. 


Volumen de una caja Los renglones (o las columnas) de 
A generan una caja con volumen [det (4)|. 





cofactor 
cramer 
deter 
eigen2 


eigshow 
eigval 
eigvec 


elim 
findpiv 
fourbase 
grams 
house 
inversa 
leftnull 
linefit 

lsq 
normal 
nulbasis 
orthcomp 
partic 
plot2d 
plu 
poly2str 
project 
projmat 
randperm 
rowbasis 
samespan 
signperm 
slu 

slu 

splu 

splv 
symmeig 


tridiag 


Estos códigos de enseñanza están dispombles directamente a partir de la Linear Algebra Home Page: 
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Calcula la matriz de cofactores de n por n, 

Resuelve el sistema Ax = bh con la regla de Cramer. 

Matriz de determinantes calculada a partir de los pivotes en PA = LU. 

Valores característicos, vectores característicos y det (A — Af) para matrices de 2 
por 2, 

Demostración gráfica de valores característicos y valores singulares. 

Valores característicos y su multiplicidad como raíces de det (A — AZ) =0. 
Calcula tantos vectores característicos linealmente 

independientes como es posible. 

Reducción de A a forma escalonada reducida R por medio de una E invertible. 
Encuentra un pivote para eliminación gaussiana (utilizado por plu). 

Construye bases para todos los cuatro subespacios fundamentales. 
Ortogonalización mediante el proceso de Gram-Schmidt de las columnas de A. 
Matriz de 2 por 12 que proporciona las coordenadas de los vértices de una casa. 
Matriz inversa (en caso de existir) por eliminación gaussiana. 

Calcula una base para el espacio nulo izquierdo. 

Grafica el ajuste por mínimos cuadrados a m puntos dados por medio de una recta, 
Solución por mínimos cuadrados de Ax = b a partir de ATAX = ATb. 

Valores característicos y vectores característicos ortonormales cuando ATA = AA', 
Matriz de soluciones especiales de Ax = O (base para el espacio nulo). 
Encuentra una base para el complemento ortogonal de un subespacio. 

Solución particular de Ax = b, con las tres variables libres iguales a cero. 
Gráfica bidimensional para las figuras de las casas. 

Factorización rectangular PA = LU con intercambios de renglones. 

Expresa un polinomio como una cadena. 

Proyecta un vector b sobre el espacio columna de A. 

Construye la matriz proyección sobre el espacio columna de A. 

Construye una permutación aleatoria. 

Calcula una base para el espacio renglón a partir de los renglones pivote de R. 
Prueba si dos matrices tienen el mismo espacio columna. 

Determinante de la matriz permutación con renglones ordenados por p. 


Factorización LU de una matriz cuadrada sin usar ningún intercambio de renglones. 


Aplica slu para resolver el sistema 4x = b sin permitir intercambios de renglones. 
Factorización cuadrada PA = LU usando intercambios de renglones. 

Solución de un sistema cuadrado invertible Ax = b. 

Calcula los valores característicos y los vectores característicos de una matriz 
simétrica. 

Construye una matriz tridiagonal con diagonales constantes a, b, c. 


http ://web.mit.edu/18.06/www. 


Fueron escritos en MATLAB y traducidos a Maple y Mathematica. 





A = LDL”, 51, 60, 319-320, 325, 
474, 480 

A = LDU, 36, 31, 224, 369, 474 

A = LU, 34-35 

A = MJM"", 300, 474 

A =QAO0”, 285, 288, 297-298, 
320-323, 474, 480 

A = QR, 174, 179, 181-182, 351, 363, 
474, 477 

A = QS, 333 

A = UYXV?, 306, 331-333, 336, 474, 
480 

A = SAS”), 245, 250, 255, 257, 267, 
300, 474 

AA*, 46, 108, 162, 222-223, 306, 
331-336, 357, 475 

ATA, 45, 108-109, 114, 161-168, 179, 
182, 184, 306, 331-335, 341, 
356-357, 363, 475, 481, 488 

AYCA, 120-124, 480 

C”, 248, 273, 280, 282, 288, 292 

eN 266-279 

PA = LU, 38-39 

CAQ”, 320-323, 327 

RRY y RTR, 51-52 

R”, 69, 72-73, 288 

STIAS, 132, 245-248, 285, 293, 299, 
301, 324, 477 


A 

4 = LU, 34, 35 

Abel, Niels Henrik, 239 

Álgebra booleana, 204 

Algoritmo avaricioso, 405 

Algoritmo Crout, 36 

Algoritmo QR, 351, 359, 364-365 

Análisis de regresión, 153 

Análisis de sensibilidad, 396 

Ancho de banda, 61, 371-372 

Apareamiento completo, 403 

Apareamiento, 403-407, 472, 476 

Aplicaciones de los determinantes, 
201, 220-229 

Applied Mathematics and Scientific 
Computing, 122, 320-321, 349 


Indice 


Árbol, 117, 123-124, 255, 405, 407 
Árbol generador, 117 

Árbol generador más corto, 405 
Área, 137, 223-229, 349, 454-455, 477 
Armoldi, 374 


B 

Base estándar, 174 

Base, 953, 141 

Bringing Down the House, 377, 412 
Buniakowsky, 155 


C 

Cadena de vectores característicos, 
423, 427 

Cálculo de A7*?, 46-47 

California, 257-258, 381 

Cambio de base, 132, 136, 294-295, 
302, 476 

Cambio de variables, 293, 390, 426 

Capacidad, 119, 401-406, 472 

Capacidad de la arista, 119 

Casos singulares, 3, 7-11, 13 

Cauchy-Buniakowsky-Schwarz, 155 

Cayley-Hamilton, 253, 304, 427, 
456-457, 476 

CD = —DC, 27, 206, 231, 302 

Cero en una posición pivote, 13, 28, 
33, 37-38, 42, 48-49, 78-84, 89, 
105, 202, 474 

Ciclo, 114-124, 146, 374, 405, 444, 
477-478 

Circunferencia unitaria, 190, 282, 298 

€”, 248, 280, 282, 283, 292 

Cofactores, 213 

Columna a la vez, 21, 26, 46, 129, 
331, 423 

Columnas multiplicadas por 
renglones, 30, 285, 333, 4783 

Combinación de columnas, 6-7, 
71-72, 92, 478 

Combinación de renglones, 429 

Combinación lineal, 6-7 

Complemento de Schur, 31, 219, 431, 
475, 480 


Complemento, 145-152 

Completamiento al cuadrado, 313, 
316-317, 345 

Composición, 131 

Composición continua, 254 

Condición a la frontera, 59, 64, 347, 
350 

Condición de Hall, 404 

Condición natural a la frontera, 59, 
64, 347, 350 

Condiciones de Kuhn-Tucker, 394, 
397 

Condiciones flojas complementarias, 
394, 409 

Conductancia, 119 

Congruencia, 324, 326 

Conjugados complejos, 281 

Conjunto factible, 378, 382 

Conjunto generador minimal, 97 

Conjunto independiente maximal, 97 

Conmutativa, 23, 25, 69 

Cono, 399-400 

Constantes arbitrarias, 59, 115 

Convergencia, 368 

Cooley, 194 

Coordenada(o), 6, 69-70, 201, 229, 
282 

Coordenadas polares, 282, 289, 333 

Corte mínimo, 402 

Coseno, 102, 152-159, 182-184, 
188-191, 198, 272, 274 

Costo de la eliminación, 14, 15 

Costos reducidos, 386, 396 


D 

Dantzig, George Bernard, 382 

De dimensión infinita, 69, 347 

Defectuoso(a), 268, 293, 299 

Degeneración, 385, 395 

Dependiente, 9-11, 80-82, 92-111, 
116-117, 259, 282, 333-335 

Descenso más pronunciado, 390 

Descomposición de Cholesky, 320 

Descomposición del valor singular 
(DVS), 331-337 


Descomposición, 32, 143, 298, 
331-338, 357, 363, 473, 
419-480 

Desigualdad de Schwarz, 154-155, 
183, 250 

Desigualdad del triángulo, 157, 262, 
358, 480 

Desigualdades, 377-381 

Determinante cero, 204 

Determinante jacobiano, 201 

Determinantes 

fórmulas, 201, 210-219 

propiedades, 203-209 

“razón de determinantes”, 1, 202, 
224 

Diagonalizable, 238, 246, 249-253, 
270, 290, 296-303, 306-308, 
427, 457, 473, 476-477 

Diagonalización de matrices, 245 

forma de Jordan, 422-427 

simultánea, 326 

transformaciones de semejanza, 
301 

Diagonalización simultánea, 326 

Diagonalmente dominante, 373 

Diferencias finitas, 61, 64, 270, 346, 
348, 354, 370, 418 

Difusión, 268 

Dilema del prisionero, 412 

Dimensión, 69-73, 81-96, 104-106, 
147, 181-183, 314-315, 416 

del espacio columna, 98 
del subespacio, 81 
del espacio vectorial, 96 

Dirección de la dimensionalidad, 371 

Distancia, 152, 155-157, 161, 
165-166, 173 

Distancias verticales, 166 

Dualidad débil, 393 

DVS. Véase descomposición del 
valor singular 


E 

e” 266-279 

Economía, 58, 153, 260-263, 265, 
379,396, 399 

Ecuación de Bellman, 406 

Ecuación de Laplace, 418 

Ecuación de onda, 275 

Ecuación del calor, 270 

Ecuación en diferencias, 59, 64, 
193, 238, 250, 254-270, 273- 
275,293, 348, 359, 367, 419 

Ecuación homogénea, 73 


= 


Ecuación normal, 162 
Ecuaciones diferenciales 
análisis de Fourier, 122 
cambio a ecuaciones matriciales, 
59 
difusión, 268 y e**, 266-279 
ecuaciones de segundo orden, 274 
ecuación diferencial parcial de 
Laplace, 418 
estabilidad, 2.70, 273 
inestabilidad, 270, 2.71, 273 
superposición, 237 
transformaciones de semejanza, 
293 
Ecuaciones diferenciales parciales, 
371, 418 
eigshow, 240 
Einstein, Albert, 21 
Ejes derechos, 175, 223 
Ejes principales, 334 
Eliminación gaussiana, 1-68 
A = LU y PA = LU, 34-35, 38-39 
casos singulares, 7-11, 13 
geometría de ecuaciones lineales, 
3-10 
notación matricial, 19-31 
ortogonalidad, 160, 184 
Eliminación hacia delante, 32, 36 
Eliminación por bloques, 120, 219, 
480 
Eliminación, 1, 9 
Elipses y elipsoides 
eigshow, 240 
espacio de Hilbert, 132, 183 
método de Khachian, 389 
matrices positivas definidas, 322 
teorema del eje principal, 285 
Energía, 272-275, 287, 334, 
339-340, 347-350 
Entrelazamiento, 343-344 
Equilibrio, 120, 122, 261, 344, 472 
Errores por redondeo, 61-63, 333, 
352, 355-336, 359, 479 
Escalar, 6, 19-71, 73-73, 126, 143, 
234, 278, 282, 339, 415, 478 
Esfuerzo cortante, 132-133 
Espacio columna, 71, 72, 104, 107 
Espacio de Hilbert, 182-183 
Espacio euclidiano, 183 
Espacio. Véase Espacio vectorial 
Espacio nulo, 71, 73, 107, 144 
Espacio nulo izquierdo, 107 
Espacio renglón, 102-110, 116-117, 
144.148, 331 


Índice 483 


Espacios de funciones, 183 
Espacios vectoriales, 69-140 
ortogonalidad, 141 
producto, suma e intersección, 
415-421 
subespacios, 102-113 
subespacios fundamentales, 
102-113 
transformación lineal, 125-137 
Esquema de cinco puntos, 371 
Estabilidad, 270, 273 
Estadistica, 122, 153, 162, 172,325 
Estado estacionario, 257-2539, 261, 
263-264, 273, 275, 306, 309, 
360, 478 
Estrategia mezclada, 408 
Existencia y unicidad, 69 
Existencia, 61, 69, 107-109, 410 
Experimento, 19, 67, 153, 163-167 
Exponencial pura, 426 
Exponenciales, 266-279 


F 
Factorización, 36, 213 
de Gram-Schmidt, 363 
factor de sobrerrelajamiento, 369 
LyU,3 
matriz de Fourier, 474 
polar, 333 
simétrica, 51 
triangular, 32-44 
Factorización LDL*, 51-53, 60 
Factorización LDU, 36-37, 41-43, 
51-53, 60-63 
Factorización LU, 33-44 
Factorización polar, 333 
Factorización OR. Véase Proceso de 
Gram-Schmidt 
Falla, 7, 13, 16, 18, 49 
Eilippov, A. F., 423 
Filtración, 189 
Fix, George, 349 
Forma de Jordan, 300, 422-427 
Forma R reducida por renglones, 
71-78 
Forma U escalonada, 77-78 
Fórmula de Euler, 117, 191 
Fórmulas para determinantes, 201, 
210-219 
de Euler, 117, 191 
pitagóricas, 142 
producto de pivotes, 47, 202 
Fredhoim, 149 
Freund, Robert, 398 


— e A NR RC 


0: 
484 indice 


Frobenius, 261-262, 479 

Función característica, 270, 346, 349 
Función de costo, 378 

Fútbol, 118-119, 124, 322 


G 

Galois, Évariste, 239 

Gauss-Jordan, 47-49 

Generación de un espacio, 94 

Geometría de planos, 2 

Gershgorin, 373-374 

Girasol, 255 

Givens, 302 

Golub, Gene Howard, 372 

Gráfica dirigida, 104, 114 

Gráficas y redes, 114-124, 401-407 

Grupo, 58, 66-67, 80, 213, 330, 351, 
402, 436, 465 


H 

Hiperplano de separación, 398-399 

Homogénea, 20, 92, 149, 237, 439, 
447 


1 
IBM, 15 
Inconsistente, 8 
Indefinida, 312-314, 322-323, 
327-330, 464, 478, 480 
Independencia lineal, 82-102 
Independencia, 92-105, 143, 164, 
330, 425 
Inercia, ley de la, 324 
Inestabilidad 
ecuaciones en diferencias, 270, 
ZII 
ecuación de Fibonacci, 259 
errores por redondeo, 63 
valores característicos y vectores 
Característicos, 234, 259, 207, 
273 
Infinidad de soluciones, 3, 8, 9 
Integración, 127, 183 
Intercambios de renglones, 32-44 
Interés compuesto, 254, 259 
Intersección de espacios, 415-421 
Introduction to Applied 
Mathematics, 122, 320, 349 
Invariante, 324, 480 
Inversa derecha, 338, 466 
Inversa izquierda, 45, 177 
Inversa, 45-48 
de un producto, 34 
de una traspuesta, 38, 45-58 


fórmula para A7?, 52, 221 
Invertibie = No singular, 48, 49 


J 
Juego de dos personas, 408 
Juego de suma cero, 409 


K 
Kernel, 104, 133, 445 


L 

Lanczoz, 374-373 

LAPACK (Linear Algebra 
PACKage), 351 

Las Vegas, 377, 412 

Lema de Schur, 296 

Leontief, 260 

Ley asociativa, 23, 29, 34, 46, 134, 
445, 476 

Ley de la corriente de Kirchhoff, 
106, 116, 117, 120, 402 

Ley de la corriente, 106, 116-117, 
120-122, 401-402, 478 

Ley de la inercia de Sylvester, 324 

Ley de la inercia, 324 

Ley de los cosenos, 152-159 

Ley de Newton, 273 

Ley de Ohm, 118-122 

Ley de Pitágoras, 141, 154, 177, 
399 

Ley del voltaje de Kirchhoff, 115, 
120, 146 

Ley del voltaje. Véase Kirchhoff 

Ley distributiva, 445, 477 

Linealmente dependiente, 92 

Longitud, 119, 404 

LU incompleta, 372 

Lyapunov, Aleksandr, 272 


M 

Mal acondicionado, 62-64, 134, 
352-353, 436 

Mantequilla de cacahuate, 380, 
392-393 

Mathematics for the Millions, 222 

MATLAB, 211, 239, 285 

Matrices complejas, 280-292 

Matrices de incidencia arista-nodo, 
104 

Matrices de incidencia, 104, 118, 401 

Matrices hermitianas sesgadas, 288, 
298 

Matrices no diagonalizables, 238, 
246, 268, 293, 299 


Matrices simétricas sesgadas, 410 
Matriz (matrices) 

acompañante, 476 

banda, 59, 61, 401 

circulante, 189 

consumo, 260 

de adyacencia, 124, 476 

de coeficientes, 3, 5, 19-22, 59-60 

de cofactores, 213-222 

de covarianza, 169-172 

de diferencias finitas, 61, 64, 270, 
346-348, 370, 418 

de Fourier, 176, 182-184, 
188-195, 287, 419, 477 

de Hilbert, 184 

de incidencia, 104, 118, 401 

de Jordan, 300-422 

de Markov, 258, 261, 273, 360 

de pagos, 408-413 

de rango uno, 109-110, 156, 306, 
479 

de tablero de ajedrez, 139, 216, 
242 

de transición, 258 

defectuosa, 238, 246, 268, 293, 
299 

de Hessenberg, 361, 365 

diagonal, 36 

diagonalizable, 246, 249 

diferencia, 59, 115-119, 221 

elemental, 22, 32, 49 

eliminación de, 22, 32 

escalonada, 77 

exponencial, 234-237, 256, 
266-274, 301, 306, 477 

hermitiana, 280 

hermitiana sesgada, 288, 298 

identidad, 22 

indefinida, 312-314, 327-330 

inversa, 45-48 

invertible, 48-49 

mal acondicionada, 62-64, 184, 
352-353, 436 

multiplicación de, 19-31 

nilpotente, 309, 479 

no diagonalizable, 238, 246, 268, 
293, 299 

no negativa, 257-262, 378-382, 
398-399 

no singular, 9, 13 

norma y número de condición, 
352-358 

normal, 162-170 

notación, 2-3, 9, 19 

ortogonal, 175 


permutación, 203, 224, 403 
positiva definida, 311-330 
positiva, 60, 261 
producto cruz, 177 
proyección, 25, 164, 238 
raíz cuadrada, 142, 181, 189-193, 
223 
rectangular, 20, 109, 114, 129, 177 
reflexión, 125 
rotación, 125, 131, 247, 365 
semejante, 293 
semidefinida, 314, 321-322, 333, 
480 
simétrica sesgada, 410 
simétrica, 50-58 
singular, 38, 204 
traspuesta, 3, 45-51 
triangular inferior, 33, 71 
triangular, 35-36 
tridiagonal, 60 
unitaria, 286, 298, 331 
Matriz acompañante, 242, 456, 476 
Matriz alargamiento, 125 
Matriz banda, 59, 61, 401 
Matriz bidiagonal, 61, 363, 364 
Matriz cero, 300 
Matriz circulante, 189, 197, 
291-292, 476 
Matriz conectividad, 115 
Matriz consumo, 260 
Matriz de cinco puntos, 372 
Matriz de cofactores, 218, 221, 226, 
454 
Matriz de covarianza, 169-172, 449, 
476 
Matriz de eliminación, 2, 22 
Matriz de Fourier, 188, 190-192, 
195-197, 287, 291, 309, 419, 
421,461, 475 
Matriz de Hessenberg, 361, 365 
Matriz de Hilbert, 184 
Matriz de Householder, 361-365 
Matriz de Markov, 244, 257-258, 
261, 273, 360, 478 
Matriz de pagos, 408-409, 413 
Matriz de transición, 258-259, 
263-264, 458 
Matriz de Vandermonde, 109 
Matriz de vectores característicos, 
245, 247, 249, 251, 253, 
291-293, 296, 331-332, 419, 
477-478 
Matriz defectuosa, 238, 246, 268, 
293, 299 


Matriz diagonal, 36, 46, 204-206, 
238, 243, 267, 322, 327-335, 
390, 415, 422 

Matriz diferenciación, 128-129 

Matriz elemental, 22, 32, 49 

Matriz entrada-salida, 260 

Matriz estable, 290, 332 

Matriz hermitiana 

característica de ser positiva 
definida, 334 

valores característicos y vectores 
característicos, 280, 283-286, 
288, 297, 298 

Matriz identidad, 22 

Matriz integración, 129 

Matriz inversa, 45-48 

Matriz masa, 321-325, 350, 406 

Matriz nilpotente, 309, 479 

Matriz no singular, 9, 13 

Matriz normal, 298, 303, 357, 479 

Matriz permutación, 203, 224, 403 

Matriz positiva definida, 311-350 

mínimos, 311-317 

principios mínimos, 339-345 

pruebas para la característica de 
ser positiva definida, 318-330 

semidefinida, 314, 321 

Matriz positiva, 60, 261 

Matriz producto cruz, 177 

Matriz proyección, 125 

Matriz raíz cuadrada, 193, 320, 332, 
334, 336 

Matriz rala, 59, 348 

Matriz reflexión, 125 

Matriz rigidez, 119, 348 

Matriz rotación, 125, 131, 247, 365 

Matriz semejante, 294, 296, 306, 
324, 361, 422, 480 

Matriz simétrica, 50-58 

QgAQ*, 320-323, 327 

simétrica LDL", 51 

valores característicos y vectores 
característicos, 280, 286, 298 

Matriz singular, 38, 204 

Matriz topología, 115 

Matriz traspuesta, 3, 45-51 

Matriz triangular inferior, 33, 71 

Matriz triangular superior, 32, 181 

Matriz unitaria, 286, 298, 331 

Matriz valor característico, 245, 
247,231, 292, 329, 331, 
474-475, 417 

Maximización del mínimo, 410 

Mecánica cuántica, 249 


índice 


Media, 178, 179 

Media aritmética, 154, 447 

Menores, 213 

Método de Gauss-Seidel, 362-371 

Método de Karmarkar, 390 

Método de Khachian, 389 

Método de potencias inverso 
desplazado, 360 

método de potencias inverso Jacobi, 
361, 368, 369, 371 

Método de potencias inverso, 360 

Método del elemento finito, 321, 346 

Método del gradiente conjugado, 
372,390 

Método del punto interior, 377, 390 

Método iterativo, 367-372 

Método simplex, 377, 379, 382-391 

Método simplex revisado, 389 

Mínimo global, 312 

Mínimo local, 312 

Mínimos cuadrados no lineales, 168 

Mínimos cuadrados, 119, 153, 
160-173, 177 

Mínimos y máximos, 311-317 

MIT, 118-119 

Modelo de von Neumann, 262 

Modo normal, 238, 275, 330 

Multiplicación de matrices, 20-21, 
194 

Multiplicación por bloques, 224 

Multiplicadores de Lagrange, 340, 
396 

Multiplicidad, 246, 301, 478, 481 

Muro frontal, 144, 382 

Mutuamente ortogonales, 143 


N 

Negativa definida, 314 

Neutralmente estable, 259 

New York Times, 119 

No hay solución, 2, 3,7, 8, 

No negatividad, 378, 383, 398 

Nodos, 104, 114-117 

Norma de una matriz, 352 

Notación sigma, 21 

Núcleo, 104, 135, 445 

Nulidad, 104-106, 127, 416 

Número de pasos de eliminación, 3, 
4,239 

Número de vectores en la base, 96 

Números complejos, 189 

Números de condición, 332 

Números de Fibonacci, 238, 255, 
236, 259 


> 1153 0 


486 Índice 


O 
Operaciones aritméticas, 14, 15 
Optimalidad, 378, 386, 394 
Orden invertido de bits, 196 
Ortogonal, 141-200 
base, 141 
complemento, 143-146 
DVS, 148 
matriz, 175 
proyección, 152-159 
valores característicos, 272 
vectores unitarios, 141 
vectores y subespacios, 141-151 
También véase Proceso de 
Gram-Schmidt 
Ortogonalización, 174, 182, 187, 
331, 375, 477, 481 
Ortonormal, 141-143, 148, 174-188 
Oscilación, 234, 270, 274-273 


Pp 
PA = LU, 38, 39 
Panqueque, 152 
Paralelogramo, 4 
Paréntesis, 6, 21-24, 34, 45-49, 134, 
213, 332, 434, 445, 476 
Patrones escalonados, 78 
Permutación, 37-45, 202-203, 
211-218 
Permutación impar, 226-227 
Permutación par, 44, 217, 230, 436, 
453 
Perpendicular. Véase Ortogonal 
Perron-Frobenius, 261, 262 
Perturbación, 62, 353, 357 
Pivoteo completo, 63 
Pivoteo parcial, 62, 352 
Pivotes, 311 
fórmulas para los pivotes, 202 
positivos, 318 
prueba, 47-49 
variables, 80-81, 384 
Pivotes diferentes de cero, 48 
Planos, 4-5 
Planos paralelos, 7, 8 
Polinomio, 389, 478, 480, 481 
Polinomio de Legendre, 182, 185 
Polinomios característicos, 235 
Polinomios por partes, 347-348 
Póquer, 377, 412-414 
Positiva semidefinida, 314, 321 
Potencial, 339, 349, 478 
Potencial en los nodos, 115 
Potencias de matrices, 255 


Preacondicionador, 368 
Precio imaginario, 393, 396 
Primer pivote, 12 
Primera búsqueda de amplitud, 406 
Primera búsqueda de profundidad, 
406 
Principio de incertidumbre, 250 
Principio de incertidumbre de 
Heisenberg, 250 
Principio de Rayleigh, 342 
Principio maximin, 344, 409, 411 
Principios mínimos, 339-345 
Problema con valor inicial, 233 
Problema de dieta, 380 
Problema de dos puntos con valor 
en la frontera, 59 
Problema de la ruta mínima, 404 
Problema de transporte, 381, 406 
Problema del matrimonio, 403-405 
Problema dual, 382-391 
Problema primal, 392 
Proceso de Gram-Schmidt, 174-187 
Proceso de Markov, 238, 257-259 
Proceso de Markov continuo, 273 
Producto. Véase multiplicación de 
matrices 
Producto cartesiano, 417 
Producto de Kronecker, 418 
Producto interno, 20, 143, 169 
Producto interno de funciones, 183 
Producto punto. Véase Producto 
interno 
Programación dinámica, 406 
Programación lineal, 377-414 
desigualdades lineales, 377-381 
modelos de redes, 401-407 
método simplex, 382-291 
problema dual, 382-391 
restricciones, 378-380 
tabla (tableau), 386-388 
teoría de juegos, 408-413 
Promedio ponderado, 169 
Proyección, 322, 328, 338, 390-392, 
416, 447-448, 450, 461, 465, 
467, 475, 479, 481 
Proyección sobre una recta, 
152-159 
Prueba de detención, 336, 388, 391, 
471 
Pruebas para la característica de ser 
positiva definida, 318-330 
Punto de intersección, 4, 5 
Punto mínimo, 311 
Puntos silla, 311-317, 408 


0 
Químico, 156, 203, 273 
OAQ”, 320-323, 327 


R 

Radio espectral, 351 

Raíces de la unidad, 189-190 

Rango como espacio columna, 92 

Rango de los renglones = rango de 
las columnas, 105 

Rango de una matriz, 83, 98, 104 

Rango total, 103, 109 

Rango uno, 87, 107-114, 138, 140, 
329,333, 337, 417-413, 
438-439, 464, 473, 479, 480 

Razones de determinantes, 1, 222, 
224 

Red, 114-119, 124, 401-407, 478 

Regla de convolución, 189 

Regla de Cramer, 202, 221-222 

Regla de las columnas, 21 

Rengión a la vez, 372 

Renglón multiplicado por una 
columna, 20 

Representación por renglón, 428, 
480 

Representación por columna, 7, 8 

Reescalamiento, 390 

Restricción, 82, 85, 340-344, 346, 
378-387, 390, 392, 394-402, 
406, 470-471, 480 

Restricciones de igualdad, 383 

R”, 69, 72-73, 288 

Rotación del plano, 361, 365, 367 

RR y RYR, 51, 52 


S 

STIAS, 132, 245-248, 285, 293, 299, 
301, 324, 477 

Semiancho de banda, 61 

Semidefinida, 314, 321, 327, 329, 
333-334, 467, 475, 480, 488 

Semiespacio, 377 

Serie de Fourier, 182 

Serie de Fourier discreta, 192 

Serie de Taylor, 315 

Seudoinversa, 108, 148, 161, 335 

Signos de los valores característicos, 
271,308, 311,314, 318, 
324-326, 329, 346, 478 

Sistema sobredeterminado, 153, 166 

Sistemas incurables, 13 

Sobredeterminado, 153, 166 

Sobrerrelajamiento, 368-371 





1 
| 
| 
| 


A A A e A 


' 
Pg a) 0 


Sobrerrelajamiento sucesivo (SRS), 
368, 369 

Soluciones especiales, 80, 81, 104 

Soluciones particulares, 82, 83 

Subdeterminado, 161 

Subespacio, 70, 98 

fundamental, 102-115, 123, 
137-139, 187, 392, 477, 481 
ortogonal, 114, 141-200, 399, 

446, 477, 479, 481 

Subespacio ortogonal, 143-149, 
151-152, 415, 479 

Subespacios fundamentales, 102-113 

Submatriz, 44, 78, 148, 196, 213, 
223, 224, 296, 318-319, 346, 
404, 407, 433, 438, 450, 472 

Submatriz principal, 87 

Sucesión de Krylov, 365 

Suma, 7-8, 21, 70-73, 82, 115, 
126-127, 176-178, 181-184 

Suma de cuadrados, 142, 160, 166, 
UFF, 182, 199..3183-323, 327, 
464 

Suma de espacios, 415-421 

Suma de vectores, 6 

Sumatoria, 142, 160, 168, 177, 182, 
199, 313-320, 327 

Superposición, 237 

Sustitución hacia atrás, 12, 36 


T 

Tabla (tableau), 386-388 

Tablero de ajedrez, 139, 216, 242 

Tensor, 2, 418 

Teorema espectral, 285 

Teorema flujo máx-corte mín, 402 

Teorema fundamental del álgebra 
lineal, 106, 116-117, 141, 
146-147, 335, 398 


FAC 
pe 


Teorema minimax, 344, 393, 409, ..:.; 
dl 


ENTRE Pida + FILA ARE 


Teoría de juegos, 377-414 

Teoría de von Neumann, 412 

Tetraedro, 158, 471 

TER. Véase Transformada de 
Fourier rápida 

Thorp, 412 

Transformación, 126-129, 131-136 

Transformación de semejanza, 
293-306 

Transformación identidad, 294 

Transformación lineal, 125-137 

Transformada de Fourier discreta, 
188, 189, 287 

Transformada de Fourier rápida 
(TFR), 188-197, 287, 372, 419, 
475, 411 

identidad fundamental, 287 
ortogonalidad, 138-197 

Traspuesta conjugada, 233 

Traza, 239-241, 243-244, 250-253 

Tukey, John, 194 


U 
Unicidad, 69 


y 

Valor característico cero, 109, 236, 
238, 241-243, 246, 438 

Valor del juego, 409 

Valores característicos diferentes de 
cero, 49 

Valores característicos distintos, 
245-247, 297-299, 303, 308, 
427, 473 

Valores característicos dobles, 246, 
422 

Valores característicos repetidos, 246 


RT AAA AV AAA Y 


A e Áhúlice 


13 
¡Valores caranterístioss y vectores 
GENT Eafacterísticos; 233-309 


487 


AF, 255-265 
cálculo, 359-366 
diagonalización, 243-254 
forma de Jordan, 300, 422 
inestabilidad, 234, 259, 270-273 
polinomio característico, 235 
matrices complejas, 280-292 
matriz positiva definida, 311 
prueba del valor característico, 320 
semejanza, 293-306 
valores característicos dobles, 
246, 422 
Variable de entrada, 387 
Variable de salida, 387 
Variable floja, 379, 383 
Variable libre, 80-85, 89-91, 94, 
104-109, 124, 384.387, 396, 
437-441, 477-481 
Varianzas y mínimos cuadrados 
ponderados, 169 | 
Vector, 2-9, 29-24 | 
Vector cero, 69 | 
Vector de costo, 382 
Vector error, 161-162, 165-167, | 
170-172 
Vector unitario, 143, 174 
Vectores característicos 
generalizados, 268 
Vectores columna, 6-7, 20 
Vértice de un conjunto factible, 
381-391, 395-397 
Volumen, 201 





W 
Wilkinson, 355 
Wronskiano, 268 


y 


Algebra lineal en pocas palabras 


DAA A AU Alan sr ib. 





infinidad de soluciones. 


(A es de n por n) 

¡ 

No singular Singular | 

A es invertible. A no es invertible. | 

Las columnas son independientes. Las columnas son dependientes. | 

¿ 

Los renglones son independientes. Los renglones son dependientes. 

¿ 

El determinante es diferente de cero, El determinante es cero. | 

Ax = O tiene una solución x = O. Áx = 0 tiene una infinidad de soluciones. | 

Ax = b tiene una solución x = A7!b, Ax = b no tiene solución o tiene una | 

| 

A tiene n pivotes (diferentes de cero). A tiene r < n pivotes. | 

A tiene rango completo r = n. Á tiene rango r< n. | 
La forma escalonada reducida R tiene por lo menos un renglón de ceros. 


por renglones es R = 1, 


AS 


El espacio columna es todo R”. La dimensión del espacio columna es r< n. 
El espacio renglón es todo R”. El espacio renglón tiene dimensión r< n. 

y 
Todos los valores característicos son Cero es un valor característico de A. 


diferentes de cero. 


A 


ATA es positiva definida simétrica. AYA sólo es semidefinida. 


A tiene n valores singulares (positivos). A tiene r < n valores singulares. 


rr dal 


Cada recta de la columna singular puede hacerse cuantitativa usando r. 
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